2017-09-26 3 views
0

Ich bekomme ValueError: zu viele Werte zum Entpacken Fehler. hier ist CodebeispielFehler beim Training von NaiveBayesClassifier mit CSV-Datensatz

import numpy as np 
import pandas as pd 
from textblob.classifiers import NaiveBayesClassifier 

sms_raw = pd.read_csv('text.csv') 
# training dataset 70% 
# test dataset 30 % 
sms_raw['split'] = np.random.randn(sms_raw.shape[0], 1) 
fltr = np.random.rand(len(sms_raw)) <= 0.7 
train = sms_raw[fltr] 
test = sms_raw[~fltr] 
cl = NaiveBayesClassifier(sms_raw) 
+0

eine Art Erklärung über die Art der Daten in text.csv oder einer Probe benötigt – sgDysregulation

+0

CSV-Datei hat zwei Spalten eine enthält Textnachricht und andere enthält Kategorie –

Antwort

0

Die NaiveBayesClassifier werden nicht mit einem Pandas Datenrahmen als Eingabe arbeiten. Auch in der letzten Zeile Sie die sms_raw Daten als Eingabe nehmen, ich nehme an Dich gedacht:

cl = NaiveBayesClassifier(train) 

Sie müssen in der CSV-Datei direkt oder wandeln den Pandas Datenrahmen auf eine Liste lesen.

Try

train.to_dict(orient='records') 
cl = NaiveBayesClassifier(train) 

mit der Wenn Sie an diesem Beispiel sehen direkt im csv lesen möchten: https://github.com/sloria/TextBlob/issues/142

Verwandte Themen