Bei einer Pandas-Serie vom Typ str möchte ich die Häufigkeiten des Ergebnisses von str.split erhalten.Pandas Zählfrequenzen innerhalb der Str-Serie
Zum Beispiel angesichts der Serie
s = pd.Series(['abc,def,ghi','ghi,abc'])
Ich möchte
abc: 2
def: 1
ghi: 2
als Ergebnis erhalten. Wie kann ich das bekommen?
Edit: Die Lösung sollte effizient mit einer großen Serie von 50 Millionen Zeilen arbeiten.
'pd.Series (s.str.split (','). Sum()). Value_counts()' - das ist schön! – MaxU
Danke, MaxU. Schöner Tag. – jezrael
Der Aufruf von 'sum()' scheint auf einem großen Datenrahmen von 50 Millionen Zeilen wirklich langsam zu sein. Gibt es eine Alternative? – David