Ich habe eine rdd wie soSplit RDD in viele RDDs und Cache
(aid, session, sessionnew, date)
(55-BHA, 58, 15, 2017-05-09)
(07-YET, 18, 5, 2017-05-09)
(32-KXD, 27, 20, 2017-05-09)
(19-OJD, 10, 1, 2017-05-09)
(55-BHA, 1, 0, 2017-05-09)
(55-BHA, 19, 3, 2017-05-09)
(32-KXD, 787, 345, 2017-05-09)
(07-YET, 4578, 1947, 2017-05-09)
(07-YET, 23, 5, 2017-05-09)
(32-KXD, 85, 11, 2017-05-09)
ich alles mit der gleichen Hilfe zu einem neuen rdd teilen wollen und dann die später für die Verwendung zwischenzuspeichern, so ein rdd pro einzigartige Hilfe . Ich sah einige andere Antworten, aber sie speichern die RDDs in Dateien. Gibt es ein Problem beim Speichern dieser vielen rds im Speicher? Es wird wahrscheinlich um 30k sein +
Ich speichere die zwischengespeicherte Rdd mit Funken Jobserver.