Ich streame einige Daten von einem API in Bezug auf Benutzer eines SaaS-Widget, und möchte einige Analysen auf "Benutzeraktivität" zu tun, um Effizienzen in dem Prozess zu finden. Ich hoffe auf Fragen wie "Was (Gruppen von Benutzeraktionen führen zum erfolgreichen Abschluss" etc.)Konvertieren von Streaming-Daten in Feature-Tabelle - Analysieren von Streaming-Daten
Derzeit sind die Daten ein zeitgestempeltes Protokoll der Antworten, einschließlich kategorischer Features über den jeweiligen Benutzer, sowie spezifische Aktionen und Antworten für diese bestimmte Interaktionsperiode:
Timestamp User Cat1 Cat2 Action Response
timenow User1 False barbar action1 response4
time(n-1) User2 False No value action1 response3
time(n-2) User1 False barbar baraction response2
time(n-3) User3 True bar action1 response1
time(n-4) User2 False foo action1 response2
time(n-5) User1 False barbar fooaction response1
ich zu einer Gruppe von Benutzern die Daten erhalten möchte, und dann alle Aktionen mit Zählungen Liste:
User Cat1 Cat2 Action1 Action2 Response1 Response 2
User3 True bar 2 1 7 1
User2 False foo 4 5 8 4
User1 False barbar 5 2 3 0
ich kann mich vorstellen, dies zu tun Outwith Pandas, Schleifen verwenden, um ein neues zu erstellen Datenrahmen in dem Format, nach dem ich suche. Ich frage mich jedoch, ob es irgendwelche ordentlichen Wege gibt, dies in Pandas zu tun, oder ob es ein besseres Format (groupbys?) Gibt, das ein ähnliches Ergebnis liefern könnte?
Hallo ysearka - in diesem Fall bin ich zu opfern die Zeitstempel, die Daten in einem anderen Format zu erhalten – TMrtSmith