ich diese Frage zu schaffen entschieden, weil the answer provided to a very similar Problem nicht für mein Szenario funktioniert:SparkR verschmelzen ohne Erstellen doppelter Spalten
ich diese beiden SparkR Datenrahmen df1
col1 col2
1 11
2 22
3 33
4 44
und DF2
zusammenführen möchtenDie dfs sollten in den Spalten 1 und 2 zusammengeführt werden. Ich habe alle Schritte versucht, die im obigen Link vorgeschlagen wurden (z. B. "by" auslassen), aber das Ergebnis sieht immer l aus ike dies:
col1_x col2_x col1_y col2_y newcol
1 11 1 11 401
2 22 2 22 402
3 33 3 33 403
4 44 4 44 404
Ich möchte keine doppelten Spalten haben und jetzt bin col1_y, col2_y manuell zu löschen und umbenennen col1_x, col2_x nur col1 haben, col2 und newcol als Ergebnis:
df <- merge(df1, df2) # <- how can I change this?
df$col1_y <- NULL
df$col2_y <- NULL
df <- withColumnRenamed(df, "col1_x", "col1")
df <- withColumnRenamed(df, "col2_x", "col2")
Ich versuchte alle Arten von Kombinationen mit der by, by.x und by.y-Anweisung, aber keine funktioniert. Gibt es eine Möglichkeit, diese langwierige Korrekturkette zu vereinfachen, indem ich einen der Schritte weglasse? Danke!
Große, verbinden und Rohr wählen Sie den Trick. –