I 2-Datenrahmen mit passenden Spalten und einen gemeinsamen Faktor zusammenführen möchten, aber mit unterschiedlichen Werten in den Zeilen, wie folgt aus:Merging Reihen in R
x <- data.frame(x = c("Uno", "Due", "Tre", "Quattro", "Cinque"), y = c("A", "B", "C", "D", "E"))
x y
1 Uno A
2 Due B
3 Tre C
4 Quattro D
5 Cinque E
y <- data.frame(x = c("Uno", "Tre", "Cinque"), y = c("F", "G", "H"))
x y
1 Uno F
2 Tre G
3 Cinque H
und ich möchte bekommen:
x y
1 Uno A, F
2 Due B
3 Tre C, G
4 Quattro D
5 Cinque E, H
Viele Beiträge lösen dies mit Aggregat und merge für Zahlen, und ich weiß nicht, was ich für Strings tun soll. Muss ich meine eigene Funktion mit Funktion (x, etc) machen?
Ist das immer ein LEFT JOIN? Oder könnte es Werte geben, die im 'x' Datenrahmen nicht vorhanden sind? Sind diese Werte im realen Beispiel auch "Faktor" oder "Charakter" Klasse? –
Hallo David, es ist nicht nur ein linker Join, X könnte Daten haben, die nicht in Y und umgekehrt vorhanden sind. Die Verbindungsspalte könnte ein Faktor sein, aber alle anderen Spalten sind Strings. – Matteo