Ich habe einen riesigen Datenrahmen. Es sieht etwa so aus:Verwendung von Ave in R ohne NA-Werte?
> b
fips vix
1400 08005 18.58862
1401 47155 10.93712
1402 51191 10.93712
1403 47059 10.93712
1404 08005 10.93712
1405 08059 10.93712
1406 47063 10.93712
1407 37021 10.93712
1408 08031 10.93712
1409 45083 10.93712
1410 37089 10.93712
1411 37113 10.93712
1412 13207 10.93712
1413 08041 10.93712
1414 47093 21.50425
1415 08031 21.50425
1416 37009 21.50425
1417 36103 21.50425
1418 08035 21.50425
1419 08031 53.58363
1420 08035 53.58363
1421 08013 53.58363
1422 55105 21.17450
1423 08001 21.17450
1424 08031 21.17450
1425 47179 21.17450
1426 08059 21.17450
1427 37009 17.35675
1428 08041 17.35675
1429 08031 17.35675
1430 08005 17.35675
1431 08001 NA
1432 08031 NA
1433 47059 NA
1434 47145 NA
1435 13207 NA
1436 37021 NA
1437 37113 NA
1438 37089 NA
ich einige der Säulen der Einfachheit halber nahm und haben nur einen Bruchteil der Reihen gezeigt. Ich versuche, die Vix-Spalte zu ändern. Was ich versuche, ist, dies zu tun:
b$vix <- b$vix - ave(b$vix,b$fips)
Was das sollte tun subtrahieren ist die Gruppe von jedem Wert von Vix bedeutet. Zum Beispiel, für Beobachtung 1400, möchte ich den Durchschnitt aller Beobachtungen nehmen, die fips == 08005 haben und dann 18.58862 minus diesen Durchschnitt machen. Das Problem ist jedoch, dass es NA-Werte gibt. Ich möchte, dass die durchschnittliche Funktion die NA-Werte IGNORIERT. Stattdessen was passiert ist, dass jede Gruppe von FIPS-Code, der eine NA als NA auftaucht hat:
> b$vix <- b$vix - ave(b$vix,b$fips)
> b
fips vix
1400 08005 2.961125
1401 47155 0.000000
1402 51191 0.000000
1403 47059 NA
1404 08005 -4.690375
1405 08059 -5.118688
1406 47063 0.000000
1407 37021 NA
1408 08031 NA
1409 45083 0.000000
1410 37089 NA
1411 37113 NA
1412 13207 NA
1413 08041 -3.209812
1414 47093 0.000000
1415 08031 NA
1416 37009 2.073750
1417 36103 0.000000
1418 08035 -16.039688
1419 08031 NA
1420 08035 16.039688
1421 08013 0.000000
1422 55105 0.000000
1423 08001 NA
1424 08031 NA
1425 47179 0.000000
1426 08059 5.118688
1427 37009 -2.073750
1428 08041 3.209812
1429 08031 NA
1430 08005 1.729250
1431 08001 NA
1432 08031 NA
1433 47059 NA
1434 47145 NA
1435 13207 NA
1436 37021 NA
1437 37113 NA
1438 37089 NA
Wie Sie sehen können, eine der fips, die eine NA haben jetzt eine NA für alle anderen Reihen geben mit den gleichen fips. Ich habe versucht, na.rm = TRUE hinzuzufügen, aber das tut nichts. Ich dachte auch darüber nach, eine andere Funktion hinzuzufügen, nämlich ave (b $ vix, b $ fips, FUN = ...), aber ich wusste nicht, was ich hinzufügen sollte. Vielleicht gibt es einen anderen Weg, dies alles zu tun. Ich hoffe, ich konnte das Problem klar erklären. Jede und jede Hilfe wird geschätzt!