Ich muss Text klassifizieren und ich benutze Text Blob Python-Modul, um es zu erreichen.Ich kann entweder Naive Bayes Klassifikator/Entscheidungsbaum verwenden. Ich bin besorgt über die unten genannten Punkte.Text Klassifizierung in Python - (NLTK Satz basiert)
1) Ich muss Sätze als Argument/kein Argument klassifizieren. Ich verwende zwei Klassifikatoren und trainiere das Modell mit apt-Datensätzen. Meine Frage dreht sich alles um muss ich das Modell mit nur Keywords trainieren? oder ich kann den Datensatz mit allen möglichen Argumenten und Nicht-Argument Beispielsätze trainieren? Was wäre der beste Ansatz in Bezug auf Genauigkeit und Zeit für die Textklassifizierung?
2) Da die Klassifizierung entweder Argument/kein Argument wäre, welcher Klassifikator würde genaue Ergebnisse liefern? Es ist Naive Bayes/Entscheidungsbaum/Positive Naive Bayes?
Vielen Dank im Voraus.