2016-10-19 2 views
0

Kann jemand erklären, wie die Beispielgrafik in der ggplot documentation geschätzt wird?Schätzung der Kerndichte in ggplot mit geom_density

Also, wie ich in der Beschreibung lesen kann, ist die Schätzung mit geom_density() eine Kernel-Dichte-Schätzung. Obwohl, sind Kerndichteschätzungen konstruiert ein Wahrscheinlichkeitsmaß sein, aber der Bereich der Grafik ist natürlich nicht 1, sondern etwas über 5.

enter image description here

Kann jemand die Mathematik hinter der Grafik beschreiben?

+0

Wenn diese Frage mehr Kreuz Validated beziehen, bitte übertragen ... –

Antwort

0

Die Gesamtfläche des Diagramms bedeutet nichts. Die Tatsache, dass die vertikale Achse von 0 bis 1 geht, bedeutet etwas bedeuten.

Die Grafik zeigt die bedingte Wahrscheinlichkeit jeder Kategorie, basierend auf dem Wert carat.

Nehmen wir zum Beispiel carat = 1. Hier nehmen ideal Diamanten einen großen Teil des vertikalen Raums ein, wie die große pinkfarbene Fläche zeigt. Umgekehrt nehmen fair Diamanten nur einen kleinen Bruchteil ein, wie der kleine rot/orange Bereich zeigt. So können wir sagen, dass mehr 1 Karat Diamanten wahrscheinlich ideal als fair sind. Jetzt nehmen wir carat = 5. Hier nimmt der rot/orange Bereich den gesamten vertikalen Raum ein und alle anderen Kategorien sind vernachlässigbar. Dies bedeutet, dass (fast) alle 5-Karat-Diamanten fair sind.

(und die Y-Achsenbeschriftung „count“ ist nicht groß, es sollte mehr wie „Wahrscheinlichkeit“ sein.)

+0

Okay, Ich weiß, wie man den Graphen interpretiert, aber ich weiß nicht, wie man die Werte berechnet, so dass sie in ein Intervall von 0 bis 1 gezwungen werden. –

Verwandte Themen