2015-07-31 6 views
5

Ich habe einen riesigen Datenrahmen. Es sieht etwa so aus:Verwendung von Ave in R ohne NA-Werte?

> b 
     fips  vix 
1400 08005 18.58862 
1401 47155 10.93712 
1402 51191 10.93712 
1403 47059 10.93712 
1404 08005 10.93712 
1405 08059 10.93712 
1406 47063 10.93712 
1407 37021 10.93712 
1408 08031 10.93712 
1409 45083 10.93712 
1410 37089 10.93712 
1411 37113 10.93712 
1412 13207 10.93712 
1413 08041 10.93712 
1414 47093 21.50425 
1415 08031 21.50425 
1416 37009 21.50425 
1417 36103 21.50425 
1418 08035 21.50425 
1419 08031 53.58363 
1420 08035 53.58363 
1421 08013 53.58363 
1422 55105 21.17450 
1423 08001 21.17450 
1424 08031 21.17450 
1425 47179 21.17450 
1426 08059 21.17450 
1427 37009 17.35675 
1428 08041 17.35675 
1429 08031 17.35675 
1430 08005 17.35675 
1431 08001  NA 
1432 08031  NA 
1433 47059  NA 
1434 47145  NA 
1435 13207  NA 
1436 37021  NA 
1437 37113  NA 
1438 37089  NA 

ich einige der Säulen der Einfachheit halber nahm und haben nur einen Bruchteil der Reihen gezeigt. Ich versuche, die Vix-Spalte zu ändern. Was ich versuche, ist, dies zu tun:

b$vix <- b$vix - ave(b$vix,b$fips) 

Was das sollte tun subtrahieren ist die Gruppe von jedem Wert von Vix bedeutet. Zum Beispiel, für Beobachtung 1400, möchte ich den Durchschnitt aller Beobachtungen nehmen, die fips == 08005 haben und dann 18.58862 minus diesen Durchschnitt machen. Das Problem ist jedoch, dass es NA-Werte gibt. Ich möchte, dass die durchschnittliche Funktion die NA-Werte IGNORIERT. Stattdessen was passiert ist, dass jede Gruppe von FIPS-Code, der eine NA als NA auftaucht hat:

> b$vix <- b$vix - ave(b$vix,b$fips) 
> b 
     fips  vix 
1400 08005 2.961125 
1401 47155 0.000000 
1402 51191 0.000000 
1403 47059   NA 
1404 08005 -4.690375 
1405 08059 -5.118688 
1406 47063 0.000000 
1407 37021   NA 
1408 08031   NA 
1409 45083 0.000000 
1410 37089   NA 
1411 37113   NA 
1412 13207   NA 
1413 08041 -3.209812 
1414 47093 0.000000 
1415 08031   NA 
1416 37009 2.073750 
1417 36103 0.000000 
1418 08035 -16.039688 
1419 08031   NA 
1420 08035 16.039688 
1421 08013 0.000000 
1422 55105 0.000000 
1423 08001   NA 
1424 08031   NA 
1425 47179 0.000000 
1426 08059 5.118688 
1427 37009 -2.073750 
1428 08041 3.209812 
1429 08031   NA 
1430 08005 1.729250 
1431 08001   NA 
1432 08031   NA 
1433 47059   NA 
1434 47145   NA 
1435 13207   NA 
1436 37021   NA 
1437 37113   NA 
1438 37089   NA 

Wie Sie sehen können, eine der fips, die eine NA haben jetzt eine NA für alle anderen Reihen geben mit den gleichen fips. Ich habe versucht, na.rm = TRUE hinzuzufügen, aber das tut nichts. Ich dachte auch darüber nach, eine andere Funktion hinzuzufügen, nämlich ave (b $ vix, b $ fips, FUN = ...), aber ich wusste nicht, was ich hinzufügen sollte. Vielleicht gibt es einen anderen Weg, dies alles zu tun. Ich hoffe, ich konnte das Problem klar erklären. Jede und jede Hilfe wird geschätzt!

Antwort

7

Sie können nur eine benutzerdefinierte Funktion verwenden, um die na.rm=TRUE Flag mean() mit

b$vix <- b$vix - ave(b$vix,b$fips, FUN=function(x) mean(x, na.rm=T)) 

mit

b<-read.table(text="  fips  vix 
08005 18 
08005 19 
08005 20 
47155 10 
47155 NA 
47155 20", header=T) 

b$vix <- b$vix - ave(b$vix,b$fips, FUN=function(x) mean(x, na.rm=T)) 
b 
# fips vix 
# 1 8005 -1 
# 2 8005 0 
# 3 8005 1 
# 4 47155 -5 
# 5 47155 NA 
# 6 47155 5 
Getestet passieren
Verwandte Themen