Ich habe zwei rdds beide sind wie folgt definiert: rdd (String, Map (String, String)), ich muss sie zusammenführen, Ie, wenn sie gemeinsamen Schlüssel haben, dann sollte die resultierende RDD sein wie rdd (string, Liste (map1, map2)) bitte lassen Sie mich die effiziente Art und Weise kennen dieseRdds mit Karten verschmelzen
-2
A
Antwort
0
Sie zu tun, um die RDDs durch die Durchführung einer vollständigen äußeren Verknüpfung wie im folgenden Beispiel fusionieren können:
val rdd1 = sc.parallelize(Seq(
("a", Map("x1"->"u1", "y1"->"v1")),
("b", Map("x2"->"u2", "y2"->"v2", "z2"->"w2"))
))
val rdd2 = sc.parallelize(Seq(
("a", Map("m1"->"p1", "n1"->"q1")),
("c", Map("m2"->"p2", "22"->"q2"))
))
val rddJoined = rdd1.fullOuterJoin(rdd2).map{
case (k, (u, v)) =>
(k, Seq(u.getOrElse(Map[String,String]()), v.getOrElse(Map[String,String]())))
}
rddJoined.collect
res1: Array[(String, Seq[Option[scala.collection.immutable.Map[String,String]]])] = Array(
(a, List(Map(x1 -> u1, y1 -> v1), Map(m1 -> p1, n1 -> q1))),
(b, List(Map(x2 -> u2, y2 -> v2, z2 -> w2), Map())),
(c, List(Map(), Map(m2 -> p2, 22 -> q2)))
)
+0
Vielen Dank. Es funktionierte :) –
Verwandte Themen
- 1. was ist die beste Praxis RDDs in scala zu verschmelzen
- 2. Wie kann ich zwei Karten über dieselbe Liste verschmelzen? automatisch
- 3. beitreten 2 RDDs scala mit
- 4. Funken Vereinigung mehrerer RDDs
- 5. mehrere RDDs zugleich
- 6. groupBy nicht groß RDDs
- 7. wie 2 verschiedene rdd in spark mit scala verschmelzen
- 8. Vergleichen von zwei RDDs
- 9. Wie RDDs zum Filtern
- 10. Zoom-Level der Karten mit HERE Karten
- 11. Scala zwei Karte verschmelzen
- 12. Code mit Quellcode verschmelzen
- 13. Zellen mit Pandas verschmelzen
- 14. libgit2: Verschmelzen mit Konflikten
- 15. Verschmelzen mit Vergleichen
- 16. Mit "git mergetool" verschmelzen
- 17. Commit mit IntelliJ verschmelzen
- 18. kombiniert zwei RDDs durch Werte in scala Funken
- 19. Best-Verfahren Inmutable Funken RDDs
- 20. zip RDDs aus verschiedenen Eingabedateien
- 21. Apache Spark - Kreuzung mehrerer RDDs
- 22. Spark RDDs - wie funktionieren sie?
- 23. Speichern von zwei RDDs parallel
- 24. RDDs und SPARK Streaming Microbatches
- 25. Wie RDDs in Spark Shell?
- 26. Funken - Joining 2 gepaart RDDs
- 27. Funktion auf kartesische RDDs anwenden
- 28. R: Karten mit Zeitschieberegler?
- 29. Twitter-Karten mit Tasten
- 30. BeanUtils mit Karten
hinzufügen Frage verwandten Code hier –