Ich bin ein Spark-Anfänger! Und ich bin verwirrt über die Beziehung zwischen Spark rdd und Spark sql. Ob Spark sql im Hintergrund zu Spark rdd konvertiert werden soll?Was ist die Beziehung zwischen Spark rdd und Spark sql?
Antwort
Soweit ich weiß, sitzen sie auf verschiedenen Motoren.
Spark SQL nutzt eine interne Sache namens Catalyst, die für die Erstellung logischer Pläne für die Arbeit und die Leistungsoptimierung in Bezug auf Codegen verantwortlich ist.
Erstens, weil Dataframe und Dataset-APIs auf den Spark-SQL-Engine eingebaut sind, verwendet er Katalysator einen optimierte logischen und physischen Abfrageplan zu erzeugen.
Die RDD api auf der anderen Seite, ist niedriges Niveau, und anscheinend Katalysator nicht wirksam einzusetzen.
Sehr dankbar für Ihre Antwort. Dies löste meine Verwirrung. – liyong
- 1. Was ist der Unterschied zwischen Spark DataSet und RDD
- 2. Was ist der Unterschied und die Beziehung zwischen lokalen R Datenrahmen und SparkR Datenrahmen und RDD
- 3. Wie kann Spark RDD zwischen zwei Spark-Kontexten geteilt werden?
- 4. Spark RDD Lineage und Speicherung
- 5. Spark RDD werfen NullPointerException
- 6. Apache Spark RDD-Workflow
- 7. Spark RDD Probleme
- 8. Spark-SQL: Konvertieren RDD [GenericData.Record], um Datenrahmen
- 9. Spark-RDD-Mapping Fragen
- 10. Spark RDD apend
- 11. Spark SQL: Wie wird es RDD-Operationen zugeordnet?
- 12. Spark-JSON Textfeld RDD
- 13. Apache Spark RDD Aufteilen "|"
- 14. Apache Spark Rdd persistent
- 15. Spark RDD Datenauswahl
- 16. Schemadefinition für Spark RDD
- 17. Beziehung zwischen RDD, Partitionen und Knoten
- 18. Etwas falsch mit Spark RDD
- 19. Unterschied zwischen Apache Spark SQL und MongoDB?
- 20. RDD und Partition in Apache Spark
- 21. Java Spark RDD in einer anderen RDD?
- 22. Spark SQL ist fehlgeschlagen in Spark Streaming (KafkaStream)
- 23. Was passiert, wenn ich die gleiche RDD zweimal in Spark
- 24. Metadaten eines Spark DataFrame (RDD)
- 25. RDD verwandeln sich in Spark-
- 26. Spark RDD Lineage Graph Darstellung
- 27. RDD-Partitionierung in Spark Streaming
- 28. Iterieren durch eine Spark-RDD
- 29. Spark RDD dynamischen Schlüssel Generator
- 30. spark versucht, die rdd aus einer Protokolldatei
finden Sie in der Programmieranleitung: http://spark.apache.org/docs/latest/programming-guide.html – mtoto
Mögliches Duplikat von [Unterschied zwischen Datenrahmen und RDD in Spark] (http://stackoverflow.com/questions/31508083/difference-zwischen-datenframe-und-rdd-in-spark) –