R verwenden, um zu bestimmen, ob Fehler normal verteilt sind:

sagen, dass ich einen Datensatz namens Lohn haben, die wie folgt aussieht:R verwenden, um zu bestimmen, ob Fehler normal verteilt sind:

wage 
# A tibble: 935 x 17 
    wage hours iq kww educ exper tenure age married black south urban sibs brthord meduc 
    <int> <int> <int> <int> <int> <int> <int> <int> <fctr> <fctr> <fctr> <fctr> <int> <int> <int> 
1 769 40 93 35 12 11  2 31  1  0  0  1  1  2  8 
2 808 50 119 41 18 11  16 37  1  0  0  1  1  NA 14 
3 825 40 108 46 14 11  9 33  1  0  0  1  1  2 14 
4 650 40 96 32 12 13  7 32  1  0  0  1  4  3 12 
5 562 40 74 27 11 14  5 34  1  0  0  1 10  6  6 
6 1400 40 116 43 16 14  2 35  1  1  0  1  1  2  8 
7 600 40 91 24 10 13  0 30  0  0  0  1  1  2  8 
8 1081 40 114 50 18  8  14 38  1  0  0  1  2  3  8 
9 1154 45 111 37 15 13  1 36  1  0  0  0  2  3 14 
10 1000 40 95 44 12 16  16 36  1  0  0  1  1  1 12 
# ... with 925 more rows, and 2 more variables: feduc <int>, lwage <dbl>

sagen, dass ich bei einer einfachen linearen Regression sucht dann btw führen und IQ:

m_wage_iq = lm(wage ~ iq, data = wage) 
m_wage_iq$coefficients

, die mir gibt:

## (Intercept)   iq 
## 116.991565 8.303064

ich überprüfen möchten, dass die Fehler sind:

ϵi∼N(0,σ2)

Wie überprüfe ich dies mit R?

Quelle

2017-11-05 Jwan622

'Plot (m_wage_iq)' gibt Ihnen einige Diagnosepläne, die dabei helfen können (oder zumindest ein Gefühl dafür bekommen). – Marius

Meiner Meinung nach ist die Frage nicht "wie man das in R macht", sondern "wie man das statisch machen will". Es gibt viele Methoden, Quantil-Quantil-Graph, Shapiro-Wilk-Test, Kolmogorov-Smirnov-Test und so weiter. Dann ist es sehr einfach zu finden, wie man das in R. macht. – JRR

Auch Rest-Plot gegen Prädiktoren usw. – SmallChess

Es gibt eine Reihe von Möglichkeiten, die Sie ausprobieren können.

Ein Weg wäre die shapiro.test auf Normalität zu testen. Ein höherer Wert als Ihr Alpha-Level (typischerweise bis zu 10%) würde bedeuten, dass die Nullhypothese (d. H. Die Fehler sind normal verteilt) nicht zurückgewiesen werden kann. Der Test ist jedoch von der Stichprobengröße abhängig, sodass Sie Ihre Ergebnisse möglicherweise durch die Betrachtung von QQplot verstärken möchten.

Sie können das sehen, indem Sie m_wage_iq (plot(m_wage_iq)) plotten und das zweite Diagramm betrachten. Wenn Ihre Punkte ungefähr auf der x = y-Linie liegen, würde das bedeuten, dass die Fehler einer normalen Verteilung folgen.

Quelle

2017-11-05 23:17:53 LyzandeR

Wie bekomme ich nur die zweite Grafik? Plot (m_wage_iq) gibt mir 4 Graphen. Wie bekomme ich nur die zweite? – Jwan622

Sie können versuchen, 'plot (m_wage_iq, was = 2)' – LyzandeR

das ist dope wie die Hölle. – Jwan622

R verwenden, um zu bestimmen, ob Fehler normal verteilt sind:

Antwort

Verwandte Themen