2017-11-03 4 views
-1

Also habe ich die folgenden Ergebnisse von Naives Bayes-Klassifizierung auf meinem Datensatz bekommt:Wie berechnet man die Genauigkeit von Klassen aus einer 7x7 Konfusionsmatrix?

enter image description here

ich stecken bin aber auf dem Verständnis, wie die Daten zu interpretieren. Ich möchte finden und vergleichen die Genauigkeit jeder Klasse (a-g). eine

enter image description here

Allerdings lässt nehmen Sie die Klasse:

Ich weiß Genauigkeit wird mit dieser Formel gefunden. Wenn ich die Anzahl der korrekt klassifizierten Instanzen - - nehme und sie durch die Gesamtanzahl von 'a' (4953) aus der Zeile a dividiere, ergibt dies ~ 6,32%. Wäre das die Genauigkeit?

EDIT: Wenn wir die Spalte anstelle der Zeile verwenden, erhalten wir 313/1199, die ~ 26,1% gibt, die eine vernünftige Zahl scheint.

EDIT 2: ich eine Berechnung der Genauigkeit von a in Excel gemacht habe, die mir 84% als die Genauigkeit gibt, mit der Genauigkeit Berechnung oben gezeigt:

enter image description here

Dies gilt nicht scheinen richtig, da die Gesamtgenauigkeit der Klassifizierung erfolgreich ist ~ 24%

Antwort

1

Nein - alles, was Sie berechnet haben, ist tp/(tp+fn), die gesamte korrekte Identifikationen der Klasse a, geteilt durch die Summe der tatsächlichen a Beispiele. Dies ist Rückruf, nicht Genauigkeit. Sie müssen die anderen zwei Zahlen einschließen.

fp ist der Rest der a Säule; tn sind alle anderen Zahlen in den Zeilen und Spalten, die 6x6-Untermatrix. Dies wird alle 35K + -Tests auf eine 2x2-Matrix mit den Labels a und not a reduzieren, der 2x2-Verwechslungsmatrix, mit der Sie bereits vertraut sind.

Ja, Sie können diese Reduktion für jede der sieben Funktionen wiederholen. Ich empfehle es programmgesteuert.


REAKTION AUF OP UPDATE

Ihre Genauigkeitist das hoch: Sie haben eine riesige Menge von wahren Negativen, nicht-a-Proben, die richtig als nicht-a eingestuft wurden .

Vielleicht ist es nicht richtig anfühlen, weil unsere Erfahrung mehr auf die betreffende Klasse konzentriert. Es gibt [andere Statistiken, die diesen Fokus behandeln.

  • Recall ist tp/(tp+fn) - alle Elemente tatsächlich in der Klasse a, wie viele Prozent haben wir richtig zu identifizieren? Dies ist die 6,32% Zahl.
  • Precision ist tp/(tp + fp) - alle Einzelteile als Klasse identifiziert a, welcher Prozentsatz tatsächlich in dieser Klasse waren. Dies ist die 26,1% Zahl, die Sie berechnet haben.
+0

Wie würde ich programmgesteuert vorgehen? – rshah

+0

Sie summieren die entsprechenden Zeilen- und Spalten-Slices aus der 7x7-Matrix. – Prune

+1

Wie betreiben Sie Weka im Moment? Wenn Sie es manuell in der Explorer-Oberfläche ausführen, klicken Sie mit der rechten Maustaste auf das Ergebnis in der Ergebnisliste und wählen Sie ** Ergebnispuffer speichern **, und importieren Sie die Datei als durch Leerzeichen getrennte Datei in ein Tabellenkalkulationsprogramm, in dem Sie das tun können Berechnung. – nekomatic

Verwandte Themen