Ich bin nur neugierig, warum die Hadoop Map Spill Größe, die io.sort.mb ist 100 MB (Standard), wenn die Blockgröße 128 MB ist. Wäre es nicht sinnvoller, ihn gleich der Blockgröße zu setzen, da eine Map-Task sowieso so viele Daten verarbeitet? Natürlich verstehe ich, dass es Probleme geben kann, mehr Arbeitsspeicher zuzuweisen, aber gibt es da noch etwas mehr?Hadoop Map Spill Größe und Blockgröße
1
A
Antwort
1
io.sort.mb ist die Gesamtmenge an Pufferspeicher, die benötigt wird, um Dateien im Speicher zu sortieren. Als ideale Faustregel sollte immer nicht mehr als 70% des gesamten RAM eingestellt werden. Die Blockgröße bezieht sich im Wesentlichen auf die Einstellung der Größe von Datei-Chunks auf einer Festplatte. Sie können Input-Splits sehr gut mit der HDFS-Blockgröße verknüpfen.
Werfen Sie einen Blick auf diesen Beitrag eine bessere Idee
http://mail-archives.apache.org/mod_mbox/hadoop-common-user/201104.mbox/%[email protected]%3E
zu erhaltenVerwandte Themen
- 1. Hadoop Blockgröße und Dateigröße Problem?
- 2. Splitgröße im Vergleich zu Blockgröße in Hadoop
- 3. Ändern der Blockgröße vorhandener Dateien in Hadoop
- 4. Hadoop Map Reduce: Algorithmen
- 5. Hadoop: map/reduce von HDFS
- 6. Hadoop Map Reduzieren lesen Sie eine Textdatei
- 7. Python ftplib Optimale Blockgröße?
- 8. Optimale Blockgröße für abgewickelte verkettete Listen
- 9. Textur spill über android öffnen gl es
- 10. Blockgröße für Kontingent unter Linux erkennen
- 11. Wie shuffle spill in Apache Spark-Anwendung zu optimieren
- 12. Auswirkungen der Änderung MemCached maximale Blockgröße
- 13. Wie bestimmt DEFLATE (zlib) die Blockgröße?
- 14. Wie Debuggen Hadoop Map Reduce Jobs von Eclipse?
- 15. Wie lese ich die Hadoop-Map-Datei mit Python?
- 16. hadoop verkleinern split size
- 17. hadoop map-reduce: wie man Nicht-Jar-Dateien implementiert
- 18. Hadoop und Stata
- 19. Elasticsearch und Hadoop?
- 20. Hadoop-Anwendungsentwicklung und PHP
- 21. GARN und Hadoop
- 22. Positionierung, Blockgröße und Hintergrund in einem CSS Dropdown-Menü
- 23. Blockgröße kann in BorderLayout nicht geändert werden
- 24. Daten in und aus Hadoop bekommen
- 25. Was ist der einfachste Weg zu erklären Was ist Hadoop und Map/Reduce?
- 26. Kombinieren von Hadoop MapReduce und Datenbankabfragen
- 27. Hadoop Counters-Dokumentation?
- 28. Hadoop Wortanzahl Beispiel
- 29. Hadoop-Profilausgabe - wo und was?
- 30. Hadoop Parameter mapreduce.map.memory.mb und mapreduce.map.java.opts