2016-05-12 21 views
-1

Ich habe zwei verschiedene Analysen. Eins mit R und eins mit Stata, basierend auf Perzentilberechnung. Ich habe jedoch eine Diskrepanz zwischen den beiden Ergebnissen aufgrund einer anderen Perzentilmethode Berechnung zwischen R und Stata. Weißt du, ob ich die Perzentildefinition der Stata in R verwenden kann?R Berechnung Perzentil mit Stata-Definition

+1

festgelegt Bitte geben Sie einige Daten, um die Unterschiede zu zeigen. Fügen Sie auch die Befehle hinzu, die Sie in Stata verwendet haben, und die Funktionen, die Sie in R verwendet haben. – lmo

+0

Entschuldigung, ich habe keine Datenmuster und Statas Befehl, um Ihnen zu liefern. Auf R verwende ich die (u) ecdf (u) (u) -Funktion. Aber Stata und R geben unterschiedliche Ergebnisse. Und ich würde gerne wissen, ob wir eine bestimmte Methode auf R wählen können. – user3355655

Antwort

3

R hat mindestens 9 Definitionen von Quantilen und Perzentilen sind nur quantile(.) * 100 . This link schlägt vor, dass das entsprechende Quantil typetype=4 wäre. Ich konnte keine Perzentil- oder Quantil-Funktion finden, die im Base Stata Manual dokumentiert ist, aber ich würde eine Korrektur gerne begrüßen, wenn diese fehlerhaft ist.

Nick Cox hat Recht. Das Quantil (der Wert in der Datendomäne) mit einer Wahrscheinlichkeit von 0,25 ist das 25. Perzentil. Die Frage erscheint auf beiden Seiten der R-Stata-Teilung unklar, weil die ursprünglichen Bemühungen in R mit der ecdf-Funktion in einer unspezifizierten Weise durchgeführt wurden. Glücklicherweise wurde das Poster mit der R-Quantil-Funktion zufriedengestellt.

Nachdem am Version 13 Stata Manual section on centile suchen, ich bin nicht sicher, dass es mit einem der R Quantils Methoden zusammenpasst, obwohl es für Perzentile den Typ = 4 Methode entsprechen weg von den „Extremen“ erscheinen würde:

Per Vorgabe schätzt Centile Cq für die Variablen in varlist und die Werte von q in centile (numlist). Es macht keine Annahmen über die Verteilung von X und verwendet bei Bedarf eine lineare Interpolation zwischen benachbarten Abtastwerten. Extreme Centile (zum Beispiel der 99. Perzentil in Proben kleiner als 100) werden auf die minimale oder maximale Probe Wert

+1

Sie meinen nicht ganz, was Sie sagen, insofern Perzentile sind ** nicht ** die Ergebnisse der 'quantile()' Funktion, multipliziert mit 100; vielmehr entsprechen die Namen oder Bezeichnungen von Perzentilen denen von Quantilen in der Art, wie Prozente oder Anteile entsprechen. 'quantile()' zeigt solche Perzentilbeschriftungen auf beliebige Weise, standardmäßig 0% 25% 50% 75% 100%. Andernfalls wird das 0.25-Quantil genau auf den Wert des 25% -Perzentils gesetzt und so weiter. –

+0

Stata hat mehrere Befehle (keine Funktionen) zum Berechnen von Quantilen oder Perzentilen, z. B. 'summarisieren',' centile' usw. Aber bis das OP genau zeigt, was in beiden Sprachen verwendet wurde, scheint es sinnlos, mehr Zeit auf den Thread zu werfen. –