Im MapReduce-Framework wird für jeden vom Mapper erzeugten Schlüssel ein Reduzierer verwendet.Hadoop MapReduce: Erläuterung zur Anzahl der Reduzierungen
Sie würden also denken, dass die Angabe der Anzahl der Reduzierungen in Hadoop MapReduce keinen Sinn ergibt, da sie vom Programm abhängig ist. In Hadoop können Sie jedoch die Anzahl der zu verwendenden Reduzierungen angeben (-D mapred.reduce.tasks = Anzahl der Reduzierungen).
Was bedeutet das? Gibt der Parameterwert für die Anzahl der Reduzierungen an, wie viele Maschinenressourcen zu den Reduzierern anstatt der Anzahl der tatsächlich verwendeten Reduzierungen gehen?
Diese Antwort ist sehr hilfreich – Tommy