Ich habe eine Liste der ‚Wörter‘ ich untermehrspaltigen Pandas auf mehreren Kriterien Zählen basierend
word_list = ['one','two','three']
zählen möchten Und ich habe eine Spalte innerhalb Pandas Datenrahmen mit Text.
TEXT | USER | ID
-------------------------------------------|---------|------
"Perhaps she'll be the one for me." | User 1 | 100
"Is it two or one?" | User 1 | 100
"Mayhaps it be three afterall..." | User 2 | 150
"Three times and it's a charm." | User 2 | 150
"One fish, two fish, red fish, blue fish." | User 2 | 150
"There's only one cat in the hat." | User 3 | 200
"One does not simply code into pandas." | User 3 | 200
"Two nights later..." | User 1 | 100
"Quoth the Raven... nevermore." | User 2 | 150
Die gewünschte Ausgabe, die Ich mag würde, ist die folgende unten, wo ich die Anzahl der Unique User zählen möchten, die Text zu jedem Wort in word_list bezogen hat, die Daten in der Spalte „Text“ gefunden werden. Nach dem Zählen der eindeutigen Benutzer möchte ich auch die Summe der Follower für jeden Tweet zählen, die mit der eindeutigen Benutzeranzahl des Worts verknüpft sind.
Word | Unique User Count | ID Sum
one | 3 | 450
two | 2 | 250
three| 1 | 150
Gibt es eine Möglichkeit, dies in Python 2.7 zu tun?
Zeile 3: KeyError: 'LEVEL_2' – Leggerless
@Leggerless fügen Sie diese in den Anfangs df.columns = [ 'TEXT', 'User', 'ID'], Ihre Spalte name contain blank – Wen
@Leggerless 'df1.stack(). reset_index()' gib dies ein, zeig mir deinen Spaltennamen – Wen