Ist es möglich, mit einem Komplement in R data.tables zu aggregieren. Beispiel unten.R, Komplement bei aggregierender Daten.Tabelle
library(data.table)
dt <- data.table(a=c("word1","word2","word2","word2"), b=c("cat1","cat1","cat1","cat2"))
Um Anzahl von bestimmten Wörtern in einer Kategorie
newdt <- dt[,(.N),by=.(a,b)]
#word1,cat1 - 1
#word2,cat1 - 2
#word2,cat2 - 1
zu bekommen Wie konnte ich die Anzahl aller anderen Worten in der Kategorie zählen? Oder ähnlich, Anzahl der anderen Kategorien, in denen das Wort ist? Etwas wie das Folgende?
#doesn't work
#newdt2 <- dt[a!=a,(.N),by=.(a,b)]
#the expected answer would be
#word1,cat1 - 2
#word2,cat1 - 1
#word2,cat2 - 0
Ich kann keine Hilfe zu diesem Thema in Online-Tutorials oder Fragen finden. Gibt es einen einfachen Weg, um die Ergänzung zu bekommen? Data.table-Lösung wäre schön, wenn man mit einer 50M-Reihentabelle arbeitet. Vielen Dank!
Es ist nicht klar über die Anforderung – akrun
Ja, ich habe auch keine Ahnung, was ist die Frage geht. Auch Ihr Beispiel ist nicht reproduzierbar. Haben Sie versucht, Ihren eigenen Code auszuführen? –
Ich verstehe es nicht ... sollte 'word2, cat2' nicht 2 sein? – Sotos