2016-09-16 6 views
0

Ich habe einen Eingang A, die ich in eine rdd X über den Cluster verteilt konvertieren.Spark Hand Daten mischen

führe ich bestimmte Operationen auf sie.

Dann mache ich .repartition(1) am Ausgang rdd.

Ist mein Ausgang rdd in der gleichen Reihenfolge wie der Eingang A.

Funkt Funken automatisch? Wenn ja, wie?

+0

Was würde Machst du das? Warum sollten die Daten auf einer einzelnen Partition neu partitioniert werden? –

+0

@YuvalItzchakov Muss die Ausgabe in einer einzigen Datei drucken. – Azrael

Antwort