sagen, dass ich die folgende Datenrahmen df
Wie viele Datensätze in einer kollabieren, während NA Entfernen Werte
name <- c("Bill", "Rob", "Joe", "Joe")
address <- c("123 Main St", "234 Broad St", NA, "456 North Ave")
favteam <- c("Dodgers", "Mets", "Pirates", NA)
df <- data.frame(name = name,
address = address,
favteam = favteam)
df
haben, die wie folgt aussieht:
name address favteam
1 Bill 123 Main St Dodgers
2 Rob 234 Broad St Mets
3 Joe <NA> Pirates
4 Joe 456 North Ave <NA>
Was ich tun möchte, ist Kollaps nach Name (oder im Allgemeinen irgendeine Anzahl von ID-Variablen) und irgendeinen anderen Wert als NA
den NA
Wert in den endgültigen Daten ersetzen, so:
df_collapse <- foo(df)
name address favteam
1 Bill 123 Main St Dodgers
2 Rob 234 Broad St Mets
3 Joe 456 North Ave Pirates
Kann Joe seine Meinung zu seinem Team ändern oder seine Adresse in der zweiten oder den folgenden Aufzeichnungen korrigieren? – vpipkt
Joe lebt vom Netz und vermeidet aktiv Datensammler. Wir konnten ihn nur zweimal aufspüren und er war vehement dagegen, uns etwas über sein Leben zu erzählen, aber zum Glück liebt er es, Baseball zu reden ... – mcjudd
Witze beiseite, verschiedene nicht-NA Antworten fügen meinem Problem eine weitere Falte hinzu, aber ich Ich dachte, ich würde es einen Schritt nach dem anderen machen. Gibt es Überlegungen, eine Hierarchie basierend auf der Reihenfolge der Ebenen in einer Faktorvariablen zu implementieren? Diese Art von Frage scheint auf SO nicht beantwortet worden zu sein ... – mcjudd