Basierend auf Informationen von Spark-Konfigurationsseite, fand ich, dass nach Netty von Funken 1.5 Off-Heap-Puffer verwendet werden, um GC während Shuffle und Cache-Block-Transfer zu reduzieren. Also, meine Frage ist, dass im heutigen Funke, was passiert im Heap-Raum während der Shuffle-Phase?was passiert auf Heap-Raum während Funken Shuffle-Stufe
1
A
Antwort
0
Im Allgemeinen speichert Spark Zwischendaten auf der Festplatte im Fall von Shuffling-Operation für "Under-hood" -Optimierung. Diese Zwischendaten werden innerhalb einer gleichen Abstammung (DAG) im Falle der Neuberechnung eines Teils der DAG.Dies kann passieren, auch wenn die RDD nicht zwischengespeichert oder explizit beibehalten wird.
spark.shuffle.file.buffer
Größe des Puffers im Speicher für jeden Ausgabestrom Shuffle-Datei. Diese Puffer reduzieren die Anzahl der Datenträgersuchvorgänge und Systemaufrufe, die in erstellt wurden, um Zwischenmischdateien zu erstellen.
Bevor 2.x.x Version
Verwandte Themen
- 1. Was passiert während eines aws Lambda-Updates?
- 2. Was passiert während Standby und Ruhezustand?
- 3. Was passiert während der String-Initialisierung?
- 4. Ionic 2: Was passiert während des Begrüßungsbildschirms?
- 5. Funken zeigen unterschiedliche Anzahl von Kernen als das, was passiert ist, es mit Funken einreichen
- 6. Was passiert während des Durchlaufs durch Referenz in C?
- 7. Was passiert während eines AcquireTokenAsync-Aufrufs mit dem Client-Zertifikat?
- 8. Wie zu analysieren, was passiert während der Aktualisierung Zeilen
- 9. Was passiert mit Methoden mit demselben Namen während der Implementierung?
- 10. Unvollständige robots.txt, was passiert?
- 11. Was passiert auf dieser meine Deklaration?
- 12. Was passiert in onSuggessionClick
- 13. WebRequest.GetResponse() ..... Was ist passiert?
- 14. Was passiert - NoSuchMethodError: com.datastax.driver.core.ResultSet.fetchMoreResults
- 15. Was passiert in __libc_start_main?
- 16. Was passiert bei Socket-Akzeptanz?
- 17. Was passiert in dieser Rückmeldung?
- 18. Was passiert, wenn make_shared
- 19. Was passiert mit Nachkommastellen?
- 20. Was passiert, wenn veröffentlicht
- 21. Was passiert? (Bekommt)
- 22. Was passiert mit customUserNamePasswordValidatorType?
- 23. Was bedeutet "lokal [*]" im Funken?
- 24. Was passiert während der Serialisierung in Java, wenn zwei References auf dasselbe serialisierbare Objekt verweisen?
- 25. Was ist mit VMDepot passiert?
- 26. Was passiert in 'Montage Fegefeuer'?
- 27. Was ist mit com.vaadin.application passiert?
- 28. Was ist mit XPathReader passiert?
- 29. Was passiert mit Office VBA?
- 30. Was passiert, wenn ich die gleiche RDD zweimal in Spark
Könnten Sie mehr Details über die Zwischendaten geben zu schlurfen. Und noch eine Sache, kann ich bedenken, dass im aktuellen Funken (2.1.0), was in Heap nur die Zwischendaten im Berechnungsjob sein werden? –
Spark 2.x.x ist etwas anders, wenn es darum geht, wo RDD/Dataset gespeichert sind. Zwischendaten werden auf der Festplatte gespeichert, unabhängig von der Version, die ich vermute.Plus Sie müssen über die Spark Memory Struktur verstehen. Ich habe gerade meine Antwort aktualisiert. – BDR
Vielen Dank für die freundliche Antwort. Eine Sache, auf die ich hinweisen möchte, ist, dass dieses Bild etwas veraltet ist. Nach dem Funken 1.6 ist der Parameter spark.shuffle.memoryFraction nur im Legacy-Modus nützlich. Sie stellen nur eine neue Speicherstruktur vor, denke ich. –