2008-08-04 12 views
24

Ich frage mich, ob es eine gute und saubere objektorientierte Programmierung (OOP) Implementierung der Bayes-Filterung für Spam-und Text-Klassifizierung gibt? Dies dient nur zu Lernzwecken.Objektorientierte Bayes-Spam-Filterung?

Antwort

12

ich auf jeden Fall empfehlen Weka Lage zu finden, was eine Open Source Data Mining Software geschrieben in Java:

Weka ist eine Sammlung von Algorithmen zum maschinellen Lernen für Data-Mining-Aufgaben. Die Algorithmen können entweder direkt auf einen Datensatz angewendet oder aus Ihrem eigenen Java-Code aufgerufen werden. Weka enthält Tools zur Datenvorverarbeitung, Klassifizierung, Regression, Clustering, Assoziationsregeln und Visualisierung. Es ist auch gut geeignet, um neue Maschinenlernschemata zu entwickeln.

Wie oben erwähnt, es wird mit einer Reihe von verschiedenen Klassifizierer wie SVM, Winnow, C4.5, Naive Bayes (natürlich) und vieles mehr (siehe API doc). Beachten Sie, dass viele Klassifikatoren eine viel bessere Leistung als Naive Bayes im Bereich der Spam-Erkennung oder Textklassifizierung bekannt sind.

Außerdem Weka bringt Ihnen eine sehr powerful GUI ...

2

nBayes - eine weitere C# -Implementierung gehostet auf CodePlex