2016-06-06 6 views
-1

Würde jemand bitte bitte erklären, was sklearn.tree.DecisionTreeClassifier.predict(X) und .predict_log_proba(X) und .predict_proba(X) sind?Python Sklearn Tree Classifier, was macht jede Vorhersagefunktion?

Vielen Dank im Voraus.

Hier ist der Link zu sklearn's library:

+1

Sie bereits auf die docs verbunden: was ist mit diesen Beschreibungen unklar ist? Alles wird beschrieben und die einzige Funktion, die nicht intuitiv sein könnte für Nicht-ML Menschen klar sein sollten, nach der Lektüre [diese] (https://en.wikipedia.org/wiki/Log_probability). – sascha

Antwort

1

Kurz Worten (und dies gilt für alle sklearn Modelle):

  • predict_proba(x) = P(y|x) (Wahrscheinlichkeit jedes Etikett als Vektor)
  • predict_log_proba(x) = log P(y|x) (Logarithmus der oben)
  • predict(x) = (das wahrscheinlichste Etikett unter Verwendung der oben)
+0

"das wahrscheinlichste Etikett mit dem oben genannten" wie in der maximalen Wahrscheinlichkeit? – user3436204

+0

Wenn Sie sich auf "Maximum Likelihood Schätzung" beziehen, dann nein. Bei MLE geht es darum, ein Modell zu finden, das die höchste Wahrscheinlichkeit für die Datengenerierung hat. Dies ist der sehr einfache arg max, einfach "wähle den Wert, der die höchste Wahrscheinlichkeit hat". So in MLE ist es anders herum, suchen Sie Theta, so dass P (x | theta) ist maximal, und hier sehen Sie für einfache maximale posterior unter bereits montiert Wahrscheinlichkeiten. – lejlot

+0

Ich sehe, vielen Dank! – user3436204