Ich sammle alle Kommentare von einigen Facebook-Seiten mit Python und Facebook-SDK.Was ist der beste Weg, um die von Facebook gesammelten Kommentare mit Python zu speichern?
Da ich Sentiment Analysis auf diese Kommentare tun möchte, was ist der beste Weg, um diese Texte zu speichern, so dass es keine Änderungen in den Texten benötigt?
Ich speichere die Kommentare jetzt als Tabelle und dann als CSV-Datei.
table.to_csv('file-name.csv')
Aber wenn ich diese gespeicherte Datei lesen möchten, erhalte ich folgende Fehlermeldung:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfc in position ...
By the way, ich bin mit den deutschen Texten zu arbeiten.
Paar Fragen. 1) Wie viele Daten möchten Sie speichern? 2) überlegst du es, irgendeine Art von DB zu implementieren, um sie zu speichern? 3) Gibt es einen Grund, warum Sie nicht einfach eine CSV-Datei verwenden sollten, trotz des Fehlers, der wie eine einfache Lösung aussieht? – SAMO
Danke @NelsCarlson für die schnelle Antwort. 1) Derzeit kann ich es nicht genau sagen, weil ich mir vorstellen möchte, dass ich alle Postnachrichten von vielleicht 50 Seiten sammeln und dann die Posts filtern soll, die ich für die Postnachricht benötige, und schließlich alle Nachrichten für jeden ausgewählten Post . 2) Nein, zum Beispiel habe ich für Kommentare eine Funktion und eine leere Liste >> emptyList.append (..) definiert. 3) Nein, für mich ist es nur wichtig, dass ich nichts verliere und die Einfachheit, um den Text für die Stimmungsanalyse zu erhalten. – Vahid
Okay, da die Daten, die Sie speichern, ziemlich relational sind (Sie finden einen Post und dann alle Nachrichten, die sich auf den Post beziehen), würde ich ein JSON-Objekt empfehlen. Es wird nur auf Ihrem Computer gespeichert wie die CSV, aber die Struktur wird wahrscheinlich die Dinge erleichtern. Etwas wie {'post_id': 001, 'message': 'hallo'} könnte Vorformoperationen viel einfacher machen. – SAMO