2017-11-05 6 views
0

sagen, dass ich einen Datensatz namens Lohn haben, die wie folgt aussieht:R verwenden, um zu bestimmen, ob Fehler normal verteilt sind:

wage 
# A tibble: 935 x 17 
    wage hours iq kww educ exper tenure age married black south urban sibs brthord meduc 
    <int> <int> <int> <int> <int> <int> <int> <int> <fctr> <fctr> <fctr> <fctr> <int> <int> <int> 
1 769 40 93 35 12 11  2 31  1  0  0  1  1  2  8 
2 808 50 119 41 18 11  16 37  1  0  0  1  1  NA 14 
3 825 40 108 46 14 11  9 33  1  0  0  1  1  2 14 
4 650 40 96 32 12 13  7 32  1  0  0  1  4  3 12 
5 562 40 74 27 11 14  5 34  1  0  0  1 10  6  6 
6 1400 40 116 43 16 14  2 35  1  1  0  1  1  2  8 
7 600 40 91 24 10 13  0 30  0  0  0  1  1  2  8 
8 1081 40 114 50 18  8  14 38  1  0  0  1  2  3  8 
9 1154 45 111 37 15 13  1 36  1  0  0  0  2  3 14 
10 1000 40 95 44 12 16  16 36  1  0  0  1  1  1 12 
# ... with 925 more rows, and 2 more variables: feduc <int>, lwage <dbl> 

sagen, dass ich bei einer einfachen linearen Regression sucht dann btw führen und IQ:

m_wage_iq = lm(wage ~ iq, data = wage) 
m_wage_iq$coefficients 

, die mir gibt:

## (Intercept)   iq 
## 116.991565 8.303064 

ich überprüfen möchten, dass die Fehler sind:

ϵi∼N(0,σ2) 

Wie überprüfe ich dies mit R?

+3

'Plot (m_wage_iq)' gibt Ihnen einige Diagnosepläne, die dabei helfen können (oder zumindest ein Gefühl dafür bekommen). – Marius

+3

Meiner Meinung nach ist die Frage nicht "wie man das in R macht", sondern "wie man das statisch machen will". Es gibt viele Methoden, Quantil-Quantil-Graph, Shapiro-Wilk-Test, Kolmogorov-Smirnov-Test und so weiter. Dann ist es sehr einfach zu finden, wie man das in R. macht. – JRR

+0

Auch Rest-Plot gegen Prädiktoren usw. – SmallChess

Antwort

1

Es gibt eine Reihe von Möglichkeiten, die Sie ausprobieren können.

Ein Weg wäre die shapiro.test auf Normalität zu testen. Ein höherer Wert als Ihr Alpha-Level (typischerweise bis zu 10%) würde bedeuten, dass die Nullhypothese (d. H. Die Fehler sind normal verteilt) nicht zurückgewiesen werden kann. Der Test ist jedoch von der Stichprobengröße abhängig, sodass Sie Ihre Ergebnisse möglicherweise durch die Betrachtung von QQplot verstärken möchten.

Sie können das sehen, indem Sie m_wage_iq (plot(m_wage_iq)) plotten und das zweite Diagramm betrachten. Wenn Ihre Punkte ungefähr auf der x = y-Linie liegen, würde das bedeuten, dass die Fehler einer normalen Verteilung folgen.

+0

Wie bekomme ich nur die zweite Grafik? Plot (m_wage_iq) gibt mir 4 Graphen. Wie bekomme ich nur die zweite? – Jwan622

+1

Sie können versuchen, 'plot (m_wage_iq, was = 2)' – LyzandeR

+1

das ist dope wie die Hölle. – Jwan622

Verwandte Themen