Können wir für hadoop 2.0 ein Architektur-Setup haben, bei dem sich alle Namensknoten in einem Cluster und alle Datenknoten in einem anderen Cluster befinden?Können wir Namensknoten in einem Cluster und Datenknoten in einem anderen Cluster haben?
Antwort
Ja. Es ist möglich.
Siehe HDFS Federation Artikel von Apache Website.
Multiple Namenodes/Namespaces
Um horizontal den Namensdienst zu skalieren, verwendet Verband mehrere unabhängige Namenodes/Namensräume. Die Namenodes sind eingebunden; Die Namenodes sind unabhängig und erfordern keine Koordination untereinander.
Die Datanodes als gemeinsamer Speicher für Blöcke, die durch die ganze Namenodes verwendet.
Jeder Datanode registriert sich bei allen Namenoden im Cluster. Datanodes senden periodische Heartbeats und blockieren Berichte. Sie behandeln auch Befehle von den Namenodes.
Dies ist die Föderation, wo NameNodes unabhängig voneinander sind und DataNodes an alle NameNodes berichten. Was das OP gefragt hat, ist ein Cluster von NameNodes (oder möglicherweise HA NameNodes) und ein Cluster von DataNodes. – alvits
- 1. Mehrere JChannels in einem Cluster
- 2. @ApplicationScoped in einem Cluster
- 3. Laufender Meteor in einem Cluster und Echtzeitänderungen
- 4. Cassandra - sstable Snapshot von einem Cluster in einen anderen kopieren
- 5. Cluster in hierarchischem Cluster auswählen
- 6. Mappers-Verteilung in einem EMR-Cluster
- 7. Mehrere Primärknoten in einem rethinkdb-Cluster
- 8. Parallele R in einem Windows-Cluster
- 9. Freigeben von Status in einem Glassfish-Cluster
- 10. Können Sie einem Oracle-Cluster-Objekt Berechtigungen erteilen?
- 11. Warum hat Hadoop verschiedene Kommunikationsmechanismen für die Kommunikation zwischen Datenknoten und Datenknoten-Namensknoten?
- 12. Mysql NDB Cluster hinzufügen einen weiteren Datenknoten nach der Einrichtung
- 13. Wie man einen Datenknoten nach dem Formatieren des Namenscodes wieder mit einem Cluster verbindet
- 14. Serverknoten in einem Cluster über Service starten und loadcache ausprobieren
- 15. OverlappingMarkerSpiderfier zeigen welche Marker in einem 'spiderfy cluster' sind?
- 16. Verbinden mit einem Redshift-Cluster von pgAdmin
- 17. Wie man MUC-Prozesse in einem Ejabberd-Cluster ausgleicht
- 18. Wie identifiziert man "Cluster-Transfer" in einem Panel-Datensatz?
- 19. Unterschied zwischen Cluster und Non-Cluster-Index in SQL
- 20. Installieren eines Funke-Clusters auf einem Hadoop-Cluster
- 21. Bereitstellen von CDH5 auf einem virtuellen Cluster?
- 22. Welche Bedeutung hat ein Mnesia-Master-Knoten in einem Cluster?
- 23. Cassandra-Snapshot (aus 3-Node-Cluster) auf Entwickler oder Test-Cluster (1-Node-Cluster) wiederherstellen
- 24. Hibernate ORM in Cluster-Umgebung
- 25. Wie zwei Cluster in mit einem Cloudera Manager mit gemeinsamem NN & GARN Server
- 26. Mehrere Parpool-Jobs auf einem Cluster ausführen
- 27. PHP-Sitzungen in einem Load-Balancing-Cluster - wie?
- 28. MySQL Cluster Fragen
- 29. DC/OS auf einem Docker Container-Cluster
- 30. PySpark verteilte Verarbeitung auf einem YARN-Cluster
Selbst wenn es möglich ist, macht es auch Sinn macht separate Cluster zu haben? Funktionieren die NameNodes weiterhin ohne DataNodes? Arbeiten DataNodes noch ohne NameNodes? – alvits