Ich habe einen zweiten Knoten zu meinem HDFS hinzugefügt. Der Master-Server hat vor dem Hinzufügen des Knotens eine Plattenauslastung von 91%. Danach wird der freie Platz immer kleiner. Ich habe den Cluster mit einem Schwellenwert von 10 neu ausgerichtet, und der Blockreplikationsfaktor ist auf 3 festgelegt. Meine Hadoop-Version ist 2.2.4.2-2. Irgendwelche Ideen, um Platz auf meinem Master-Knoten zu schaffen?HDFS: Wie Freiraum/Neuausgleich nach dem Hinzufügen neuer Knoten?
Antwort
Sie hatten einen einzigen Datenknoten, der vermutlich alle HDFS-Blöcke enthielt. Jeder Block hatte nur eine Kopie. Wenn Sie einen zweiten Knoten hinzufügen und den Replikationsfaktor 3 beibehalten, kopieren Sie bestenfalls jeden Block auf den neuen Knoten, um einen tatsächlichen Replikationsfaktor 2 zu erhalten (jeder Block hat 2 Kopien, eine auf jedem Knoten). Keine Speicherplatzreduzierung auf dem früheren einzelnen Knoten. Wenn Sie dann einen dritten Datenknoten hinzufügen, erzielen Sie im besten Fall 3 Kopien für jeden Block, einen auf jedem Knoten, und keine Reduzierung des Speicherplatzes auf dem ursprünglichen Knoten. Nur wenn Sie einen vierten Knoten hinzufügen, kann eine Verringerung der Festplattennutzung erreicht werden, indem etwa 1/4 der Blockreplikate vom ursprünglichen Knoten entfernt werden.
Sie müssen entweder Ihren Replikationsfaktor reduzieren oder mehr als 3 Knoten hinzufügen. 6 Knoten erreichen eine 50% ige Reduktion bei Replikationsfaktor 3. Oder ändern Sie den Replikationsfaktor auf 1 und erzielen Sie eine Reduktion von 50% mit nur 2 Knoten, wobei das Risiko besteht, dass Sie Blöcke verlieren.
Danke für Ihre Antwort! Wenn ich den Blockreplikationsfaktor auf 2 reduziere, hat jeder Datenknoten eine Kopie von jedem Block und erreicht 33% Reduktion, richtig? – Jonas
nur, wenn Sie 3 Knoten hinzufügen. Der Replikationsfaktor 2 auf zwei Knoten muss 100% der Blöcke auf jedem Knoten platzieren. –
Nur um sicher zu sein. Ein Replikationsfaktor höher als die Anzahl der Daten wird ignoriert und jeder Datenknoten enthält nur eine Kopie eines Blocks? Ich bin etwas verwirrt, weil die Größe des Datenordners von Knoten 1 1,7 TB und Knoten 2 eine Größe von 1,2 TB hat. – Jonas
- 1. Refresh JFrame nach dem Hinzufügen neuer Komponenten
- 2. Wie Cassandra-Cluster nach dem Hinzufügen neuer Knoten neu zu balancieren
- 3. Wie aktualisiere ich Gridview nach dem Hinzufügen neuer Zeile?
- 4. Dynamisches Hinzufügen neuer Knoten in Cassandra
- 5. reintselect.js reinitialisieren nach dem Hinzufügen neuer Select-Steuerelemente mit Javascript
- 6. App kann nicht nach dem Hinzufügen neuer benutzerdefinierter View-Controller
- 7. SearchBar funktioniert nicht mehr nach dem Hinzufügen neuer Objekte
- 8. Warum RichTextBox verlieren Format nach dem Hinzufügen neuer String?
- 9. Spawn Knoten nach dem Zufallsprinzip
- 10. Hinzufügen neuer Abhängigkeit zu package.json in Knoten verursacht Fehler
- 11. Geschachteltes Set-Modell und SQLAlchemy - Hinzufügen neuer Knoten
- 12. Hinzufügen neuer Knoten zu einem SVG <use> Tag
- 13. Hinzufügen oder Hinzufügen neuer stateObject zum Verlauf
- 14. Besorgt: Korrupte HDFS auf einzelnen Knoten - wie zu lösen
- 15. Weird UITableView Verhalten nach dem Scrollen und Einfügen neuer Zeile
- 16. Verschiedene Knoten nach dem Zufallsprinzip erzeugen
- 17. vue.js - Hinzufügen neuer Wert nach Klick auf Objekt
- 18. Hinzufügen neuer Spalte nach Spalte und Definieren eines Standards
- 19. System.MissingMethodException nach dem Hinzufügen eines optionalen Parameters
- 20. wie die hadoop-hdfs-Protokolle unter/var/log/hadoop-hdfs
- 21. Hinzufügen neuer Funktionen zu einer Klasse mit dem Import
- 22. Hinzufügen neuer Tabellenzeile nach der aktuellen Zeile mit jQuery
- 23. Hoch- und Runterwandeln nach dem Hinzufügen neuer statischer Konstanten zu abgeleiteten Typen
- 24. Django - Formular Dropdown-Liste aus der Datenbank nicht sofort aktualisiert nach dem Hinzufügen neuer
- 25. So holen Sie alle Daten nach dem Hinzufügen neuer Daten in der Firebase-Datenbank
- 26. Warum funktionieren die Preise für Eingabefelder nicht nach dem dynamischen Hinzufügen neuer Felder?
- 27. Google Tabellen - Hinzufügen neuer Zeilen nach dem ersten Bearbeiten der angegebenen Spalten/Datenüberprüfung
- 28. Einfügen neuer Ausdruck nach Anweisung über Roslyn
- 29. Hinzufügen neuer Symbole zu OpenUI5?
- 30. Wie entstehen Remote-Akteure beim Beitritt neuer Knoten in akka?
Was ist Ihr "Master-Server"? HDFS hat Namenknoten und Datenknoten. Kein "Meister". –
Mein 'Master-Server' enthält den Namen und einen Datenknoten. Der zweite Server ist der zweite Datenknoten. – Jonas
Sie haben also Replikationsfaktor 3 auf einem Cluster mit 2 Datenknoten? –