2013-03-05 8 views
12

Sorry, ich bin neu bei WEKA und lerne gerade.Wie man die Klassifikationsmatrix in WEKA liest

In meinem Entscheidungsbaum (J48) Klassifikator Ausgang gibt es eine Verwirrung Matrix:

a b <----- classified as 
130 8  a = functional 
15 150 b = non-functional 
  • Wie lese ich diese Matrix? Was ist der Unterschied zwischen einem & b?
  • Kann mir auch jemand erklären, welche Domainwerte sind?

Antwort

20

Haben Sie die gelesen? Der Text um die Matrix herum ist in ihrem Beispiel etwas anders angeordnet (Zeilenlabel links statt rechts), aber Sie lesen es genauso.

Die Zeile gibt die wahre Klasse an, die Spalte gibt die Klassifikatorausgabe an. Jeder Eintrag gibt dann die Anzahl der Instanzen von an, die als <column> klassifiziert wurden. In Ihrem Beispiel wurden 15 Bs (fälschlicherweise) als As klassifiziert, 150 Bs wurden korrekt als Bs usw. klassifiziert.

Daher sind alle korrekten Klassifizierungen von oben links nach unten rechts diagonal. Alles auf dieser Diagonale ist eine falsche Klassifizierung.

+0

Bin ich richtig, dass der CM in WEKA ist: Zeile 1: 'TP | FP' Zeile 2: 'FN | TN' –

+0

@ user75782131: Ich würde es nicht so sagen. Ihr Anspruch auf True Positives usw. gilt nur für 2-Klassen-Probleme, bei denen es klare positive und negative Klassen gibt. Viele Klassifikationsprobleme sind nicht so, aber sie haben immer noch Verwirrungsmatrizen. – Junuxx

+0

Und für 2-Klassen-Problem, wenn positive Klasse Index 0 hat, bedeutet dies, dass die erste Zeile TP, FN ist, und die zweite Zeile ist FP, TN. – silmeth

7

ich es würde so:

Die Verwirrung Matrix ist die Berichterstattung Weka auf, wie gut dieses J48 Modell ist in Hinblick darauf, was es wird richtig, und was es wird falsch.

In Ihren Daten war die Zielvariable entweder "funktional" oder "nicht funktional"; Die rechte Seite der Matrix sagt Ihnen, dass die Spalte "a" funktional ist und "b" nicht funktioniert.

Die Spalten sagen Ihnen, wie Sie Ihr Modell Ihre Proben eingestuft - es ist, was das Modell vorhergesagt:

  • Die erste Spalte enthält alle Proben, die Ihr Modell sind „a“ denkt - 145 von ihnen, insgesamt
  • die zweite Spalte alle Proben enthält, die Ihr Modell denkt sind „b“ - 158 von ihnen

die Zeilen, auf der anderen Seite der Realität entsprechen:

  • Die erste Zeile enthält alle Proben, die wirklich sind „a“ - 138 von ihnen, insgesamt
  • Die zweite Reihe alle Proben enthält, die wirklich „b“ sind - 165 von ihnen

das erkennende Spalten und Zeilen, können Sie in die Details graben:

  • oben links, 130, sind Dinge, die Ihr Modell wirklich denkt, dass „a“ sind die „a“ < sind - diese
  • unten links korrekt waren, 15 , sind das? NGS Ihr Modell denkt sind „a“, aber die wirklich „b“ sind < - eine Art von Fehler
  • oben rechts, 8, sind Dinge, die Ihr Modell denkt „b“ sind, aber wirklich „a“ < sind - andere Art von Fehler
  • unten rechts, 150 sind Dinge, die Ihr Modell „b“ denkt, dass sind die wirklich „b“

So oben links und unten rechts auf der Matrix sind Dinge, die Ihr Modell bekommt rechts zeigt .

Unten links und oben rechts in der Matrix werden die Bereiche angezeigt, in denen das Modell verwechselt wurde.