2016-05-29 4 views
1

Ich mache die Übungen von Einführung in Data Mining, berechnen und wurde auf folgende Fragen zu Entscheidungsbaum fest:Wie die Verallgemeinerung Fehlerrate eines Entscheidungsbaums

Ausbildung Training

Testing Testing

Entscheidungsbaum Decision tree

Die Frage fordert mich auf, die Generalisierungsfehlerrate zu berechnen, indem optimistische und pessimistische Ansätze verwendet werden, und die Antworten sind 0,3 bzw. 0,5. Sie sind völlig anders als meine Antworten 0,5 und 0,7. Aus meiner Berechnung sind die Instanzen 3, 7, 8, 9, 10 Fehlklassifikationen. Ich habe viele Dokumentationen auf Google gesucht, und alle haben nicht erklärt, warum und nur gezeigt, dass 3/10 = 0,3. Bitte sagen Sie mir, was ist der Fehler, den ich gemacht habe, Danke!

Antwort

0

Du hast das falsch, missclassified ist:

  • in der Ausbildung: 3, 5, 6
  • in der Prüfung: 12, 13, 14, 15

Ihr Entscheidungsbaum ist:

  • return + iff (nicht a und nicht b) oder (a und c)
so

zum Beispiel für 3:

A = 0 B = 1 C = 0 class = +, und Ihre DT liefert - als A = 0 und B = 1

1

Ich denke, Ihre Antworten sind richtig, Die Antwort des Lösungshandbuchs ist falsch, und Sie haben beim Reproduzieren des Baums einen Fehler gemacht - in meiner Kopie des Buchs lesen Sie die Blattknotenbeschriftungen von links nach rechts, +, -, +, -. Ihr Baum mit den Blattknoten +, -, -, + führt zu 30% bzw. 50% für die optimistischen bzw. pessimistischen Fehlerschätzungen.

Mit Blattknoten +, -, +, - sind die Fehler in der Tat 50% und 70%.

Verwandte Themen