Kann jemand bitte teilen, wie man eine dataframe
zu einer RDD
konvertieren kann?Wie konvertiert man DataFrame zu RDD in Scala?
Antwort
einfach:
val rows: RDD[Row] = df.rdd
Verwenden df.map(row => ...)
die Datenrahmen zu einer RDD konvertieren, wenn Sie eine Zeile in eine andere RDD Element zuordnen möchten. Zum Beispiel
df.map(row => (row(1), row(2)))
gibt Ihnen ein gekoppeltes RDD, wo die erste Spalte der df der Schlüssel ist, und die zweite Spalte des df ist der Wert.
Ich suchte nur nach meiner Antwort und fand diesen Beitrag.
Jean 's Antwort zu absolut korrekt, fügte hinzu, dass "df.rdd" wird eine RDD [Zeilen] zurückgeben. Ich muss split() anwenden, sobald ich RDD bekomme. Dafür brauchen wir RDD [Row} bis RDD [Zeichenfolge]
val opt=spark.sql("select tags from cvs").map(x=>x.toString()).rdd
Fro mich arbeiten noch einfachere Methode zu konvertieren:
// Data frame creation from csv
//-----------------------------------------------------------------------------------------------------------------
val sacramentoDF = sqlContext.read
.format("com.databricks.spark.csv")
.option("header", "true") // Use first line of all files as header
.option("inferSchema", "true") // Automatically infer data types
.load("src/main/data/Sacramento.csv")
// RDD creation from Data frame
//-----------------------------------------------------------------------------------------------------------------
val sacramentoRDD = sacramentoDF.rdd
1) Databricks-Paket wird nicht benötigt auf Spark 2, das Sie upgraden sollten, wenn Sie es nicht benutzen. 2) 'sacramentoDF.rdd' ist nur das, wonach die Frage gefragt wurde, und das ist bereits die akzeptierte Antwort –
- 1. Wie konvertiert man Funke DataFrame zu RDD mllib LabeledPoints?
- 2. Wie konvertiert man eine fallklassenbasierte RDD in einen DataFrame?
- 3. Wie konvertiert RDD [Zeile] zu RDD [Vektor]
- 4. Wie konvertiert man RDD [(String, String)] in RDD [Array [String]]?
- 5. Convert Datenrahmen zu RDD [Karte] in Scala
- 6. Von DataFrame zu RDD [LabeledPoint]
- 7. RDD kann nicht in Sequenz konvertiert werden
- 8. Wie konvertiert man Matrix zu RDD [Vector] in spark
- 9. Wie konvertiert man ein DataFrame wieder in normale RDD in Pyspark?
- 10. Wie konvertiert man HadoopRDD zu DataFrame in EMR Spark?
- 11. Wie konvertiert man PythonRDD (von Zeilen in JSONs) zu DataFrame?
- 12. Partition Lage RDD/Dataframe
- 13. Wie exportiert man DataFrame zu CSV in Scala?
- 14. Wie konvertiert man String zu Datum Uhrzeit in Scala?
- 15. Wie konvertiert .class- in Scala
- 16. Zeppelin: Scala Dataframe zu python
- 17. Spark konvertiert ein Dataset zu RDD
- 18. Wie konvertiert man einen Pandas/Dataframe in XML?
- 19. Spark: Wie konvertiert man RDD [(Long, Iterable [String])] in RDD [(Long, String)]?
- 20. Umwandlung eine Spalte in einem RDD/Dataframe
- 21. Wie konvertiert man JSON String in Dataframe auf Spark
- 22. Wie konvertiert man OpenDocument-Tabellen in einen Pandas DataFrame?
- 23. Konvertieren eines Scala Iterable [Tupel] zu RDD
- 24. Wie konvertiert man von scala Map zu scala.collection.immutable.HashMap?
- 25. Spark/Scala: RDD zu Funktion übergeben
- 26. Konvertieren von RDD zu Datenrahmen scala - NoSuchMethodError
- 27. Wie erstellt man DataFrame aus mehreren Arrays in Spark Scala?
- 28. Funken Scala: Vektordatenrahmen zu RDD von Werten
- 29. Konvertieren von RDD [org.apache.spark.sql.Row] zu RDD [org.apache.spark.mllib.linalg.Vector]
- 30. Wie konvertiert man eine java.util.Collections.unmodifyableMap in eine unveränderliche Scala Map?
, wenn Sie „nicht gefunden Typ“ entweder für RDD erhalten oder diese Macht Row help: 'val Zeilen: org.apache.spark.rdd.RDD [org.apache.spark.sql.Row] = df.rdd' – Boern
Um Boerns Antwort zu erweitern, fügen Sie die folgenden zwei Importbefehle hinzu: import org.apache.spark .rdd.RDD import org.apache.spark.sql.Row – Ravi