2016-05-31 6 views
3

Ich arbeite mit Mikrodaten der American Community Survey unter Verwendung des survey Pakets und hoffe, einige grundlegende Statistiken zur Einkommensungleichheit zu berechnen. Ich habe die folgende als mein Design eingerichtet:Messung der Einkommensungleichheit mit Hilfe des R-Erhebungs-Pakets

testsurv <- svrepdesign(data=test, repweights = test[,8:87], weights = test$HHWT, 
        combined.weights=TRUE, type = "Fay", rho = 0.5,scale=4/80, 
        rscales = rep(1, 80), mse=TRUE) 

Von diesem, würde ich Gini-Koeffizienten von Jahr berechnen möchten, sowie Quantils Verhältnisse von Einkommen, auch nach Jahren. die Quantile zu erzeugen und die damit verbundenen Fehler ist unkompliziert mit svyby und svyquantile:

quants <- svyby(~INCOME, ~YEAR, testsurvey, svyquantile, 
       quantiles=c(0.9, 0.75, 0.5, 0.25, 0.1), keep.var=TRUE) 

Das hat mich auf meine erste Frage bringt: Wie berechne ich die die Standardfehler für Verhältnisse von Einkommen quantiles (zB 90/10), wenn ich Haben Sie die replikatgewichtsbasierten Fehler für jedes Quantil? Ich habe versucht, svyratio, aber das ist für die Verhältnisse der gesamten Variablen, nicht für ausgewählte Beobachtungen innerhalb der Variablen.

Zweite Frage: Gibt es eine Möglichkeit, den Gini-Koeffizienten (mit replikatbasierten Fehlern) innerhalb von survey mit vorhandenen Funktionen wie gini von reldist zu berechnen? Ich versuchte mit withReplicates aber es funktioniert nicht gut, vielleicht, weil gini seine Argumente als Variable bestellt, dann Gewichte, aber die Anweisungen für withReplicates geben Sie die umgekehrte Reihenfolge. Ich habe beide Wege ausprobiert, aber keiner hat funktioniert. Zum Beispiel ist das, wo HHWT die Einwaagen:

> withReplicates(testsurv, gini(~HHWT, ~INCOME)) 

dass die folgende Fehlermeldung ergibt:

Error in sum(weights) : invalid 'type' (language) of argument 
In addition: Warning message: 
In is.na(x) : is.na() applied to non-(list or vector) of type 'language' 

Antwort

1

die R vermitteln Paket verwenden. dies ist noch nicht auf CRAN, aber Sie können es schnell für das Verhältnis von 90. bis 10. mit

devtools::install_github("djalmapessoa/convey") 

installieren, verwenden Sie die ?svyqsr Funktion und setzen alpha=-0.1, weil es standardmäßig auf der 80. und 20.

für der Gini-Koeffizient, verwenden Sie die ?svygini Funktion

Diese sollten beide einfache Berechnungen sein, solange Sie die Acs Replikat-gewichteten Umfrage-Design haben. Achten Sie darauf, die Funktion convey_prep sofort nach dem Anruf svrepdesign zu verwenden!

+0

Dank Anthony - Ich freue mich darauf, es auszuprobieren (und danke auch für Ihre großartige Website, die eine großartige Ressource ist)! – user115457

+0

ist es auf CRAN jetzt –

+0

Anthony - das ist eine lächerlich späte Antwort, aber ich wollte Ihnen für den Zeiger auf dieses fantastische Paket danken. Es ist ein großer Beitrag und für mein Projekt unverzichtbar. – user115457