2015-07-31 7 views
6

identifizieren kann Ich habe die Daten wie unten und ich muss die Verteilung der Daten identifizieren. Bitte helfen.Wie man die Verteilung der gegebenen Daten mit r

x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40) 
+2

Bitte definieren Sie (mit einiger Strenge bezüglich der statistischen Sprache), was Sie genau meinen, "identifizieren Sie die Verteilung der Daten". – Roland

+1

Was meinen Sie mit "identifizieren Sie die Verteilung" ... Sie können 'hist (x)' verwenden, um seine Form zu sehen. In Bezug auf "strenge Beweise" (eigentlich nie streng ...), Hypothesentest .. –

+1

Dies scheint eher eine Statistik als eine Programmierfrage. Bitte OP klarstellen, was Sie zu tun versuchen. – nicola

Antwort

4

Erstens, was Sie tun können, ist das Histogramm zu zeichnen und überlagern die Dichte

hist(x, freq = FALSE) 
lines(density(x)) 

Dann sehen Sie, dass die Verteilung bimodale ist und es könnte Mischung aus zwei Verbreitung und jede sein andere.

Sobald Sie eine Kandidatenverteilung identifiziert haben, kann Ihnen ein 'qqplot' helfen, die Quantile visuell zu vergleichen.

+0

Gibt es eine andere Möglichkeit, die Verteilung automatisch zu identifizieren? –

19

Ein sauberer Ansatz würde Verwendung von fitdistrplus Paket, das Werkzeuge für die Verteilung passend zur Verfügung stellt. Am Beispiel Ihrer Daten.

library(fitdistrplus) 
descdist(x, discrete = FALSE) 

enter image description here

Jetzt können Sie verschiedene Distributionen zu passen versuchen. Zum Beispiel:

normal_dist <- fitdist(x, "norm") 

abs inspizieren anschließend den Sitz:

plot(normal_dist) 

Fitting


Als Ober Punkt würde ich vorschlagen, dass Sie einen Blick auf this discussion bei Cross Validated haben, wo das Thema ausführlich diskutiert wird. Sie können auch gerne einen Blick auf ein Papier von Delignette-Muller und Wutang - fitdistrplus: Ein R-Paket für Fitting Distributionen, verfügbar here, wenn Sie sich für eine detailliertere Erklärung zur Verwendung der Cullen und Frey Graph interessiert sind .

+3

Der Link zur Diskussion über Lebenslauf ist ein sehr wichtiger Teil dieser Antwort. (+1) – Roland

+1

So interpretieren Sie dieses Diagramm cullen and frey –

+2

@VanathaiyanS Der Graph ** CF ** vergleicht den Skew und die Kurtosis der angegebenen Verteilung mit der angegebenen Verteilung. Ich schlage vor, dass Sie sich die verlinkte Diskussion im Lebenslauf, in der Hilfedatei und im verlinkten Papier ansehen. Um es kurz zu fassen: * Für einige Verteilungen gibt es, wie üblich, nur einen möglichen Wert für die Schiefe und die Kurtosis, also gibt es einen Punkt auf dem Graphen. Für andere Verteilungen sind die Bereiche möglicher Werte dargestellt. Dies ist sehr vereinfacht Antwort Sie sollten auch andere Methoden in Betracht ziehen, aber die ** CF ** Grafik ist ein guter Anfang. – Konrad

Verwandte Themen