Anfänger hier, ich arbeite mit Spark 2.1.1 und Scala 2.11.8.Wie man eine Spalte von RDD mit anderen Spalten der (a) gleichen (b) verschiedenen RDD abbildet?
Ich habe eine RDD mit sechs Spalten. Dies ist der erste Eintrag der RDD: -
(String, String, String, String, String, String) = (" p69465323_serv80i"," 7 "," fb_406423006398063"," guest_861067032060185_android"," fb_100000829486587"," fb_100007900293502")
Die tatsächliche RDD hat mehr als 5 Millionen Einträge.
Ich möchte die erste Spalte einzeln mit dem dritten, vierten, fünften und sechsten Spalten in einer solchen Art und Weise abzubilden, dass ich etwas bekommen wie: -
(fb_406423006398063, p69465323_serv80i)
(guest_861067032060185_android, p69465323_serv80i)
(fb_100000829486587, p69465323_serv80i)
(fb_100007900293502, p69465323_serv80i)
dh die erste Spalte mit dritten individuell zugeordnet ist, vierte, fünfte und sechste Spalte. Wie kann ich dies (a) in der gleichen RDD (b) in verschiedenen RDDs tun? Deklarieren
Dank !! Aber ich habe hier eine Frage, wird die gleiche Lösung für zwei verschiedene RDDs funktionieren? Dies ist in Bezug auf eine Frage, die ich heute veröffentlicht habe: https://stackoverflow.com/questions/44819655/how-to-perform-set-transformations-on-rdds-with-different-number-of-columns – PixieDev
@AviAggarwal Sie meinen Kartenspalten von einer zur anderen? Nein, das kannst du damit nicht machen. Die Lösung zu dieser Frage sieht gut aus. Wie dort vorgeschlagen, müssen beide RDDs vom selben Typ sein. – philantrovert