So habe ich einen großen Datenrahmen mit vielen Spalten. Sagen wir, die zwei Hauptspalten, die mich interessieren, sind Nachrichten und Namen. Jede Nachricht ist so etwas wie ein persönlicher Status und wird von dem Namen der Person begleitet. Nehmen wir an, ich habe eine Wortbank von Gefühlen/Gefühlen, die ziemlich groß sind, aber eine komprimierte Version könnte wie [traurig, glücklich, erleichtert, verärgert, wütend, ekstatisch, stolz] aussehen ',' enttäuscht ']. Für jeden Namen (und Namen könnten wiederholt werden, da sie mehrere Nachrichten haben könnten), möchte ich die Emotionsworte, die sie verwendet haben, und die zugehörigen Zählungen verfolgen. Zum Beispiel (ich habe dies seit ich eine wirklich große Datenmenge habe aus):Wie man ein Wörterbuch von Wörterbüchern (oder etwas mit ähnlicher Funktionalität) in Pandas behält?
Message Name
I am really happy with my progress. Alice
I was annoyed by his inconsideration. John
I felt proud after seeing her performance. Lisa
I am ecstatic after hearing the good news. Alice
I felt disappointed by her dishonesty Lisa
Wenn ich etwas wollte, das mir im Wesentlichen sagen würde folgend (ich nicht unbedingt über das Format kümmern, solange es sauber ist): {Alice: glücklich: 1, ekstatisch: 1; John: genervt: 1; Lisa: stolz: 1, enttäuscht: 1}.
Was ist der beste/einfachste Weg, dies zu tun? Ist ein Lexikon der Wörterbücher der beste Weg, dies zu tun? Zweitens (dies ist eine Art zusätzliche Frage), nach der obigen Berechnung, was ist, wenn ich das am häufigsten verwendete Emotionswort für jeden Namen finden möchte. In diesem Beispiel ist alles ziemlich gleich 1, aber stellen Sie sich vor, dass die Zählungen nicht gleich waren.
Wenn eine Zeile zweimal "message" enthält, möchten Sie sie als eins oder zwei zählen? – exp1orer
Wie in zum Beispiel, die Nachricht für eine einzelne Zeile hat zweimal "glücklich"? Ich hatte nicht wirklich daran gedacht, aber zweimal ist gut. –