Ich möchte eine lineare Regression auf Umfragedaten mit Umfragegewichten machen.Wie berechnen OLS Regression mit Survey Weights in Python.
Die Umfragedaten stammen aus der EU und jede Beobachtung hat ein Gewicht. (0,4 für eine Ein Teilnehmer, 1,5 für einen anderen.)
Dieses Gewicht wie beschrieben wird:
„The European Gewicht, variable 6 erzeugt eine repräsentative Stichprobe von der Europäischen Gemeinschaft als Ganzes, wenn Diese Variable passt die Größe jeder nationalen Stichprobe entsprechend dem Beitrag jedes Landes an die Bevölkerung der Europäischen Gemeinschaft an. "
Um meine Berechnung zu tun verwende ich sklearn.
from sklearn import linear_model
regr = linear_model.LinearRegression()
regr.fit(X,y, sample_weight = weights)
X ist ein Pandas Datenrahmen. y ist ein numpy.darray. Gewichte ist eine Pandas-Serie.
Ich benutze 'sample_weight' richtig, ist dies der richtige Weg, um Umfragegewichte in scikit zu behandeln?
Dank einer Million, die wirklich nützlich war! –
@ TiarnándeBurca Kein Problem. Wenn dies Ihre Frage beantwortet, sollten Sie es akzeptieren. Wenn nicht, dann kommentiere mit Punkten, die ich verpasst habe oder bearbeite deine Antwort, um sie auszuarbeiten. – josh
Ich denke, ich habe es als akzeptiert markiert. (Ich habe versucht, es zu verbessern, weil ich dachte, dass das der Mechanismus war, aber ich habe nicht genug 'rep', um das zu tun.) Nochmals vielen Dank. –