Ist es möglich, Werte mit demselben Schlüssel auf verschiedenen Reduzierern zu verarbeiten? von allen Mappern habe ich Daten mit gleichem Schlüssel und möchte sie mit verschiedenen Reduzierungen verarbeiten? meine Verwirrung ist, dass das Buch sagt, dass alle Werte mit dem gleichen Schlüssel zur gleichen Minderer gehen ...Gleiche Taste verschiedene Reduzierungen (HADOOP)?
mapper1(k1,v1),mapper2(k1,v2),mapper3(k1,v3) and so on...
ich möchte nicht alle Daten zu gleichen Minderer ... es wie,
reducer1(k1,v1),reducer2(k1,v2)....
sein sollte
und können sagen, reducer1 sum1 und reducer2 produzieren sum2 zu produzieren, und ich will, dass
sum=sum2+sum1
wie sollte ich das tun?
Gibt es einen Grund, warum Sie die oben mit einem Kombinierer cant do .. und dann die Ausgaben der Kombinierer im Minderer zusammenfassen? – Suchet
in der Annahme, dass ich sehr große Daten habe (sagen wir, ich habe riesige Anzahl von Zeilen in einer Matrix und am Ende möchte ich Summe aller Elemente), kann ich dies für einen Split in Combiner jetzt zusammenfassen, wenn die Summe als wollen ein ganzes ich muss Ausgabe aller Kombinierer in einen reduzieren (i dnt 9 anderen Weg), was zu einem sehr langsamen Prozess führt ... – Divyendra
Sie profitieren nicht von der verteilten Natur von Hadoop. Partitionieren Sie Ihre Daten so, dass mehrere Mapper gleichzeitig an Ihren Eingabedateien arbeiten. Probleme wie diese sind trivial. – Suchet