2016-09-26 4 views
-2

ich die folgenden Datensätze haben ... datasetNaiveBayes Klassifizierung in NLTK Python mit

Ich habe die Daten laden mit dieser

import numpy as np 
import pandas as pd 
input_file = "C:/Users/User/Documents/R/exp.csv" 
df = pd.read_csv(input_file, header = 0) 

Nun, ich versuche, dies zu tun ...

classifier = nltk.NaiveBayesClassifier.train(labeled_featuresets) 

Wie kann ich dorthin gelangen?

+0

Warum lesen Sie die Daten mit 'header = 0'? Anscheinend haben die Daten * einen Header. – lenz

+0

Ich weiß es nicht. Ich fand es suchen und habe keine Ahnung, warum es dort verwendet wurde. – Hanson

+0

Für mich hört sich das so an, als würden Sie einige Tutorials zu Python und wahrscheinlich zu Pandas durcharbeiten. Zuerst müssen Sie den eingefügten Code verstehen und versuchen, selbst eine Brücke zwischen den beiden Fragmenten zu bauen. Dann komm zurück, wenn du eine spezifischere Frage hast. – lenz

Antwort

0

Sie können Informationen über NLTK und seine Funktionen mit ihrer online tutorial finden.

Insbesondere sollten Sie in Features und Klassifikatoren suchen, die beide in Chapter 6 gefunden werden können.

Funktionen sind einfach Funktionen, die basierend auf einer Eingabe einen Wert zurückgeben, so dass Sie diese Funktionen um das Datenformat von Pandas herum erstellen können.

Verwandte Themen