Ich habe eine RDD mit viele Spalten (z. B. Hunderte), wie füge ich eine weitere Spalte am Ende dieser RDD?Wie füge ich einer Spark RDD eine neue Spalte hinzu?
Zum Beispiel, wenn mein RDD ist wie unten:
123, 523, 534, ..., 893
536, 98, 1623, ..., 98472
537, 89, 83640, ..., 9265
7297, 98364, 9, ..., 735
......
29, 94, 956, ..., 758
wie kann ich eine Spalte, um es hinzuzufügen, dessen Wert die Summe der zweiten und der dritten Spalte?
Vielen Dank.
Beachten Sie, dass Datenrahmen unveränderlich sind. Sie können einen nicht ändern, aber Sie können einen neuen aus einem alten machen ... siehe http://stackoverflow.com/questions/29109916/updating-a-dataframe-column-in-spark – Paul