Ich möchte verschiedene Dinge nach ID und nach Reihenfolge (Zeit) zählen. Zum Beispiel mit:R Datentabelle - Berechnung für jede Zeile mit allen Zeilen vor der aktuellen Zeile
dt = data.table(id=c(1,1,1,2,2,2,3,3,3), hour=c(1,5,5,6,7,8,23,23,23), ip=c(1,1,45,2,2,2,3,1,1), target=c(1,0,0,1,1,1,1,1,0), day=c(1,1,1,1,1,1,3,2,1))
id hour ip target day
1: 1 1 1 1 1
2: 1 5 1 0 1
3: 1 5 45 0 1
4: 2 6 2 1 1
5: 2 7 2 1 1
6: 2 8 2 1 1
7: 3 23 3 1 3
8: 3 23 1 1 2
9: 3 23 1 0 1
I, für jede ID zählen möchte, die Anzahl der aktiven Tage und aktive Stunden, bisher, für jede Zeile. Was bedeutet, ich möchte folgende Ausgabe erhalten:
id hour ip target day nb_active_hours_so_far
1: 1 1 1 1 1 0 (first occurence of id when ordered by hour)
2: 1 5 1 0 1 1 (has been active in hour "1")
3: 1 5 45 0 1 2 (has been active in hour "1" and "5")
4: 2 6 2 1 1 0 (first occurence)
5: 2 7 2 1 1 1 (has been active in hour "6")
6: 2 8 2 1 1 2 (has been active in hour "6" and "7")
7: 3 23 3 1 3 0 (first occurence)
8: 3 23 1 1 2 1 (has been active in hour "23")
9: 3 23 1 0 1 1 (has been active in hour "23" only)
Um die Gesamtzahl der aktiven Stunden bekomme ich tun würde: auch
dt[, nb_active_hours := length(unique(hour)), by=id]
aber ich möchte haben die bisher Teil . Ich weiß nicht, wie das geht ... Jede Hilfe wäre willkommen.
Sie wollen also nicht '8' in' id == 2'? –
Der 'aktive' Teil ist nicht klar. – akrun
Es tut uns leid, wenn es unklar ist. Ich möchte die Anzahl der bisher gesehenen eindeutigen "Stunden" -Werte zählen (das heißt für alle vorherigen Zeilen, * ohne die aktuelle Zeile *). – tucson