Ich habe eine große Liste in JavaPairRDD<Integer, List<String>>
und ich möchte eine FlatMap tun, um alle möglichen Kombinationen von Listeneinträgen zu bekommen, so dass ich am Ende mit JavaPairRDD<Integer, Tuple2<String,String>>
. Im Grunde genommen, wenn ich etwas habe, wieGroße Liste FlatMap Java Spark
(1, ["A", "B", "C"])
Ich mag bekommen:
(1, <"A","B">) (1, <"A", "C">) (1, <"B", "C")
Das Problem ist, mit großen Listen wie das, was ich getan habe, ist eine große Liste von Tuple2 Objekten erstellt, indem eine verschachtelte Schleife über die Eingabeliste. Manchmal passt diese Liste nicht in den Speicher. Ich fand dieses, aber nicht sicher, wie es in Java implementieren: Spark FlatMap function for huge lists
Dank nutzen könnten versuchen, die Arbeiten sollten, ich habe es verpasst. – ilijaluve