Ich bin neu in Python. Ich habe eine CSV-Datei, die Tweets gereinigt hat. Ich möchte eine Tasche mit Wörtern dieser Tweets erstellen. Ich habe den folgenden Code, aber es funktioniert nicht richtig.Wie erstellt man einen Beutel mit Wörtern aus der CSV-Datei in Python?
import pandas as pd
from sklearn import svm
from sklearn.feature_extraction.text import CountVectorizer
data = pd.read_csv(open("Twidb11.csv"), sep=' ')
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(data.Text)
count_vect.vocabulary_
Fehler:
.ParserError: Error tokenizing data. C error: Expected 19 fields in line 5, saw 22
Mögliches Duplikat von [Python Pandas Error Tokening Daten] (https://stackoverflow.com/questions/18039057/python-pandas-error-tokenizing-data) –
Es wäre nützlich zu klären * wo genau * in Ihrem Code der Fehler tritt auf ... – desertnaut
Wenn ich den Code jetzt ausführe, bekomme ich diesen Fehler: 'DataFrame' Objekt hat kein Attribut 'Text' –