Aggregate Reihen in Pandas Dataframe

Ich habe Pandas Datenrahmen mit den folgenden Spalten:Aggregate Reihen in Pandas Dataframe

VisitorID (einzigartig für jeden Benutzer - Cookies in Ihrem Browser)

VisitNumber (1 = erste Besuch, 2 = zweiter Besuch und etc ...)

TimeSpentOnVist (Besuchsdauer in Sekunden)

Channel (der Referrer des Besuchs. Ex: Facebook, Google und Bing)

Medientyp (gegen Entgelt oder organisch)

Die Besucher-ID für jeden Besuch wiederholt (1, 2, 3). Ich möchte es in Anbetracht des letzten Besuchs für den Kanal und den Medientyp aggregieren, aber gleichzeitig die Zeitpunkte aller Besuche zusammenfassen (zusammenfassen). Mein Ziel ist es, nach der Besucher-ID zu gruppieren, so dass es keine Duplizierung gibt.

Was ist der effizienteste Weg, um diese Aggregation in Pandas durchzuführen?

Quelle

2017-11-03 Legos

IIUC

df.sort_values(['VisitNumber']).groupby('VisitorID').\ 
    agg({'TimeSpentOnVist':'sum','Channel':'last','Media type':'last'})

Quelle

2017-11-03 16:38:38 Wen

Wen beantwortet die Aggregation Frage, aber ich würde auch ein MultiIndex zu organisieren, um den Datenrahmen erstellen:

df.set_index(['VisitorID','VisitNumber']).sort_index()

Quelle

2017-11-03 16:49:30 Sebastian

Aggregate Reihen in Pandas Dataframe

Antwort

Verwandte Themen