2016-05-05 12 views
0

Ich bin verwirrt über die Verwendung von Wahrscheinlichkeitsgewichten (Gewicht, in Stata), insbesondere in Bezug auf die Verwendung für RDD. Ich bin nach oben auf einer Antwort hier zu finden:Fuzzy RDD und Stata Pgewicht Ausgabe

https://stats.stackexchange.com/questions/121750/fuzzy-rdd-issue

Ich verstehe, dass das Beispiel/Antwort von @Dimitri einen Grenzwert von 0 und eine Bandbreite von plus verwendet/minus 1. Die Linie

gen w = max (0,1-abs (z))

gibt 0 für w außerhalb dieser Bandbreite und 1 für Werte genau am Cutoff.

Meine Frage: Verwendet das Gewicht nicht die Umkehrung von w? I.e. macht nicht pweight genau das Gegenteil von dem, was wir gerne erreichen würden, indem wir den Kanten hohe Gewichtung geben und den Beobachtungen um den Cut-off herum Null beilegen? Ich bin verwirrt ...

Danke für Ihre Hilfe!

Antwort

1

Ich glaube nicht, dass Ihr Verständnis der Wahrscheinlichkeitsgewichte korrekt ist. Stata gewichtet eine Beobachtung mit 100 mehr als einer mit 10, nicht weniger. Die Gewichte sind in gewissem Sinne bereits "invertiert".

Zum Beispiel finden Sie in den folgenden Code:

#delimit; 
clear; 
set obs 2; 
gen y=100*(_n-1); 
gen w=10 in 1; 
replace w=100 in 2; 
list y w, clean noobs; 
reg y [pw=w]; 
gen x=_n; 
tw scatter y x [pw=w], ms(Oh); 

Wie Sie sehen können, die zweite Beobachtung mit einem pweight von 100 ist wichtiger in der Durchschnittsberechnung und ist auch prominent in der Grafik.

+0

Großartig - das macht Sinn. Ich war verwirrt über den umgekehrten Teil. Ich würde deine Antwort abstimmen, wenn ich könnte. Vielen Dank! – andtie

+1

@andtie Sie können dies als Antwort auswählen, indem Sie auf das Häkchen klicken. –