Ich beginne mit NaiveBayes/Simple Klassifikator für die Klassifizierung (Weka), aber ich habe einige Probleme zu verstehen, während das Training der Daten. Der Datensatz, den ich verwende, ist weather.nominal.arff.interpretieren Naive Bayes Ergebnisse
Während ich den Einsatz Trainingstest aus den Optionen verwenden, das Klassifikator Ergebnis:
Correctly Classified Instances 13 - 92.8571 %
Incorrectly Classified Instances 1 - 7.1429 %
a b classified as
9 0 a =yes
1 4 b = no
Meine erste Frage, was sollte ich von den nicht korrekt zugeordnete Instanzen zu verstehen? Warum ist ein solches Problem aufgetreten? Welche Attributsammlung ist falsch klassifiziert? Gibt es eine Möglichkeit, das zu verstehen?
Zweitens, wenn ich die 10-fache Kreuzvalidierung versuche, warum bekomme ich verschiedene (weniger) korrekt klassifizierte Instanzen?
Die Ergebnisse sind:
Correctly Classified Instances 8 57.1429 %
Incorrectly Classified Instances 6 42.8571 %
a b <-- classified as
7 2 | a = yes
4 1 | b = no
danke für die klare antwort und weka tip + 1. der verwirrende Punkt ist voreingenommen, was meinst du? Sollte ich immer Kreuzvalidierung für alle meine verschiedenen Klassifikationsalgorithmen verwenden? – berkay
Denken Sie darüber nach, Sie wollen ein Naive Bayes-Netz lernen, das Ihre Daten modelliert, dann wollen Sie seine Vorhersagegenauigkeit testen. Wenn Sie das Modell trainieren und es mit denselben Instanzen testen, dann überschätzen Sie seine Genauigkeit (es hat sich gezeigt, dass diese speziellen Beispiele damit gut abschneiden), werden aber wahrscheinlich bei neuen Daten weniger erfolgreich sein. Der Schlüsselpunkt hier ist ** Generalisierung **: Wir wollen über die Instanzen hinaus, die zur "Trainingszeit" zur Verfügung gestellt wurden, zu neuen ungesehenen Beispielen verallgemeinern. – Amro
Amro danke für klare Antworten. Ich poste hier, um eine Frage des Rückrufs und der Genauigkeit von Kreuzvalidierungsergebnissen zu stellen. Recall (7/(2 + 7)) = 0778 und Genauigkeit ist (1/(1 + 4)) = 0.2, aber Weka sagt für die Präzision = 0.636? Irgendeine Idee dazu? – berkay