Ich führe ein HDFS mit 32 Slaves.hdfs Datenschräglauf, warum sind die Dateien nicht gleichmäßig verteilt?
Jeder Slave hat rund lokalen Speicherplatz 300GB verbleibenden (der Rest ist nicht für HDFS.)
Wenn ich 32 * 100 GB Dateien setzen, die Dateien in nur einige Sklaven geliefert werden. Es stürzt die Aufgabe aufgrund des fehlenden Speicherplatzes ab.
Wie kann ich dieses Problem vermeiden?