0

Ich habe das Buch "Einführung in das statistische Lernen" gelesen. Das Buch sagt, dass:Bedeutung der Fehlerbedingung e

Allgemein angenommen, dass wir eine quantitative Antwort Y und eine Reihe von Prädiktor Variablen X1, X2, .... Xn beobachten.

Wir gehen davon aus, dass es eine Beziehung zwischen Y und X (X1, X2, ... Xn), die in sehr allgemeiner Form wie folgt geschrieben werden kann:

Y = f (X) + e

Hier ist f eine feste, aber unbekannte Funktion von X und e ist ein zufälliger Fehlerterm, der unabhängig von X ist und einen Mittelwert von Null hat.

Ich möchte wissen, was es bedeutet, Null bedeutet?

+1

Es scheint, dass e im Wesentlichen Rauschen ist (z. B. in der Messung), so dass sich die Anzahl der Beobachtungen sehr groß/in Richtung unendlich entwickelt, e sich zu Null ausmitteln wird. – StuartLC

Antwort

1

Ich möchte wissen, was es bedeutet, Null bedeutet?

Es bedeutet, dass e, als Zufallsvariable behandelt Wert von 0. Mit anderen Worten erwartet hat, wenn Sie Durchschnitt dieser Fehler berechnen, dann mit dem Probensatz bis ins Unendliche wächst - auf Null konvergiert. In praktischer Hinsicht bedeutet dies einfach, dass Ihr Rauschen nicht Ihre f (x) -Funktion ändert, aber wenn Sie ein "positives" Rauschen beobachten, gab es genau die gleiche Wahrscheinlichkeit, "negatives" Rauschen desselben zu beobachten Stärke. Beachten Sie, dass, wenn Sie e mit mittleren m haben würde dies bedeuten, dass

E[f(x) + e] = E[f(x)] + E[e] = E[f(x)] + m 

somit für jeden einzelnen Punkt „x“ Sie erwarten würden Wert f beobachten (x) + m statt nur f (x). So wäre es das gleiche sein, wie die Modellierung

g(x) + e' 

wo

g(x) = f(x) + m 

und e' ist jetzt Null-Mittel zufälliges Rauschen. Somit ist die gesamte statistische Einstellung immer noch gültig für ein mittleres Rauschen ungleich null, aber dann besteht Ihre Aufgabe (die ML löst) nicht darin, "f" sondern "g" zu modellieren.

0

Sagen wir zur Veranschaulichung, dass Ihre Fehler normalerweise verteilt sind, da wir diese Einstellung in einleitenden Einstellungen oft machen. Wenn Sie bereit sind, dies zu akzeptieren, dann ist eine andere Art zu denken über null Mittelfehler, zu sagen, dass Ihre Ergebnisvariable Y selbst eine Zufallsvariable ist, die wie N (f (X), Sigma^2) verteilt ist. Mit anderen Worten, das Ergebnis ist wie eine Zufallsauslosung aus einer verteilten Wahrscheinlichkeit, die bei f (X) zentriert ist. Beachten Sie, dass, wenn Sie für jedes beobachtete Y verschiedene Xs haben, Sie sehen, dass sich der Wert von f (X) ändert und sich somit auch die Normalverteilung ändert, die jedes beobachtete Ergebnis Y generiert. Dennoch sind alle Beobachtungen durch diese Grundregel (f) daran gebunden, wie Merkmale (d. H. Ihre X-Daten) den Verteilungen zugewiesen wurden, die Ihre Ergebnisse erzeugt haben.