data.tables бар біріктірілмегендер

Итератордың сұрағынан шабыттанған «біріктірілмегендер» үшін data.table идиомасына қатысты сұрағым бар . Міне мысал:

library(data.table)

dt1 <- data.table(A1=letters[1:10], B1=sample(1:5,10, replace=TRUE))
dt2 <- data.table(A2=letters[c(1:5, 11:15)], B2=sample(1:5,10, replace=TRUE))

setkey(dt1, A1)
setkey(dt2, A2)

data.table мына сияқты көрінеді

> dt1        > dt2
   A1 B1        A2 B2
 [1,] a 1     [1,] a 2
 [2,] b 4     [2,] b 5
 [3,] c 2     [3,] c 2
 [4,] d 5     [4,] d 1
 [5,] e 1     [5,] e 1
 [6,] f 2     [6,] k 5
 [7,] g 3     [7,] l 2
 [8,] h 3     [8,] m 4
 [9,] i 2     [9,] n 1
[10,] j 4     [10,] o 1

dt2 ішінде қандай жолдарды бірдей кодты табу үшін dt1 ішінде , параметрін TRUE деп орнатыңыз:

> dt1[dt2, which=TRUE]
[1] 1 2 3 4 5 NA NA NA NA NA

Мэтью осы ұсынысты ұсынды answer ,» non join «идиомасының деп жазылған

dt1[-dt1[dt2, which=TRUE]]

dt2 ішінде шықпайтын индекстер бар жолдарға dt1 жиынтығын қосыңыз. Менің компьютерімде data.table v1.7.1 қате пайда болды:

Error in `[.default`(x[[s]], irows): only 0's may be mixed with negative subscripts

Оның орнына, nomatch = 0 параметрімен бірге «қосылмаған» жұмыс істейді

> dt1[-dt1[dt2, which=TRUE, nomatch=0]]
   A1 B1
[1,] f 2
[2,] g 3
[3,] h 3
[4,] i 2
[5,] j 4

Бұл мінез-құлық бар ма?

14
V1.8.3-ге ғана қосылған, not-join синтаксисі. Бұл жағдайда dt1 [! Dt2] . Толық жауапты қосады ...
қосылды автор Matt Dowle, көзі

3 жауаптар

V1.8.3-те жаңа:

A new "!" prefix on i signals 'not-join' (a.k.a. 'not-where'), #1384.
 DT[-DT["a", which=TRUE, nomatch=0]]  # old not-join idiom, still works
 DT[!"a"]               # same result, now preferred.
 DT[!J(6),...]             # !J == not-join
 DT[!2:3,...]             # ! on all types of i
 DT[colA!=6L | colB!=23L,...]     # multiple vector scanning approach
 DT[!J(6L,23L)]            # same result, faster binary search
'!' has been used rather than '-' :
 * to match the 'not-join' and 'not-where' nomenclature
 * with '-', DT[-0] would return DT rather than DT[0] and not be backwards
  compatibile. With '!', DT[!0] returns DT both before (since !0 is TRUE in
  base R) and after this new feature.
 * to leave DT[+...] and DT[-...] available for future use
17
қосылды

Менің білуімше, бұл R базасының бөлігі.

# This works
(1:4)[c(-2,-3)]

# But this gives you the same error you described above
(1:4)[c(-2, -3, NA)]
# Error in (1:4)[c(-2, -3, NA)] : 
#  only 0's may be mixed with negative subscripts

Мәтіндік қате туралы хабар оның болып табылады мінез-құлық білдіреді.

Міне, неге деген мақсатты мінез-құлық туралы менің ең жақсы болжам:

Басқа жерде (мысалы, na.rm = FALSE ) әдеттегідей NA ) емдеу жолынан R's дизайнерлері NA маңызды ақпаратты алып жүреді және оны нақты нұсқауларсыз түсіріп жіберуді қаламайды. (Бақытымызға қарай, nomatch = 0 параметрі осы нұсқаулықты орындаудың таза әдісін береді!)

Бұл тұрғыда дизайнерлердің артықшылығы, NA дегеннің неге оң индекстеу үшін қабылданады, бірақ теріс индекстеу үшін емес:

# Positive indexing: works, because the return value retains info about NA's
(1:4)[c(2,3,NA)]

# Negative indexing: doesn't work, because it can't easily retain such info
(1:4)[c(-2,-3,NA)]
5
қосылды
+1 Жақсы жауап! Иә, бұл базадан. FR # 1384 X [-Y] синтаксисін «қосылмаған» дегенді білдіреді. Ал арада деген = TRUE, номерчик = 0 қажет.
қосылды автор Matt Dowle, көзі

Деректер.таблица 1.7.3 нұсқасында жаңа:

datatable.nomatch жаңа нұсқасы нөмір берушіге арналған әдепкі параметрді береді   N-дан 0-ге дейін өзгерді, ...

2
қосылды
Бұл өзгеріс аздап көмектесе алады, бірақ шын мәнінде «қосылуға» арналмаған. FR # 1384 әлі де істеу керек. Жақсы көру үшін біреуді оқи алады NEWS :)
қосылды автор Matt Dowle, көзі