2009-04-02 4 views
11

Eine schnelle Google-Suche zeigt, dass es eine gute Anzahl von Bayes'schen Klassifikatoren gibt, die als Python-Module implementiert sind. Wenn ich möchte, verpackt, High-Level-Funktionalität ähnlich dbacl, welche dieser Module ist richtig für mich?Welche Python Bayesian Textklassifizierungsmodule sind ähnlich wie Dbacl?

Ausbildung

% dbacl -l one sample1.txt 
% dbacl -l two sample2.txt 

Klassifizierung

% dbacl -c one -c two sample3.txt -v 
one 

Antwort

9

Ich denke, Sie werden die nltk hilfreich. Genauer gesagt, die classify module.

+0

Ich glaube nicht, NLTK enthält einen Feature-Auswahl-Algorithmus, aber es hat Frequenz Dist Tools usw., so dass Sie Ihre eigenen schreiben und es an den Klassifikator Ihrer Wahl füttern können. – apexdodge

0

Wenn Sie versuchen, Sprache zu erkennen this funktioniert gut, auch mit ziemlich kurzen Texten.

Die API ist ganz in der Nähe, aber Ich weiß nicht, ob es ein Bayesian Classifier genannt wird.

1

diese Frage Bemerkt. Ich habe meine Implementierung eines naiven Bayesian Classifier auf GitHub.

Here it is - beiyesi

Es muss noch eine Menge Verbesserungen. Jede Hilfe wird geschätzt.

-1

Versuchen Sie Mallet und LingPipe. Sie bieten mehr Modelle für den Klassifikator.

+0

Dies sind Java-Bibliotheken, nicht Python. – tripleee

Verwandte Themen