0
einzelnes Element Trans habe ich eine RDD von Zeichenketten wie untereine RDD von n Elementen in eine RDD von
val rdd1: RDD[String] = RDD("a","b","c","d")
Ich möchte die Elemente der oben RDD verketten und in ein RDD von einzelnen Element transformieren wie unter
RDD("a,b,c,d")
Was ist der beste Weg, dies zu tun?
Möchten Sie wirklich eine 'RDD' eines einzelnen Elements? Was ist der Wert für die Verwendung einer _distributed_-Sammlung, wenn sie nur einen Eintrag enthält? Wenn nicht, und Sie nur an diesem einzelnen Datensatz interessiert sind, können Sie 'rdd1.collect() aufrufen. MkString (", ")' –
Ich wollte das Ergebnis in HDFS mit der Methode rdd saveAsTextFile speichern. Aus diesem Grund wollte ich es in eine andere RDD umwandeln. – yAsH
@raHul Sie müssen das nicht tun. Wenn Sie, wie bereits erwähnt, alle Daten in eine einwertige RDD zerquetschen, macht es keinen Sinn, ein verteiltes Verarbeitungs-Framework zu verwenden. 'saveAsTextFile' übernimmt das für Sie und verteilt Ihre Ergebnisse auf HDFS. –