2017-08-29 13 views
1

Sagen wir, ich habe drei Datensätze und ich möchte mehrere Fragen beantworten, indem Sie all diese drei Datensätze/Dateien beitreten. wenn zuerst zum Beispiel Datenbestand hat (id, Name) und das zweite hat (id, sum, Schlüssel) und das dritte hat (Schlüssel, Preis).So verbinden Sie mehrere Datensätze in mapreduce

Wie erste und die zweite Datei mit id und im gleichen Programm zu verbinden, wie zweite und dritte mit Schlüssel auch mitmachen?

Antwort

1

Dies ist nicht im selben Programm möglich. Um das zu erreichen, was Sie tun möchten, müssen Sie zwei Map-Reduce-Jobs ausführen.

Die erste Karte-reduzieren Job präzediert die erste Datei und die zweite Datei, die eine Ausgabedatei, deren Format erzeugt, ist folgende -

id name,sum,key 

In dem obigen ist der Reduzierer Taste „ID“ und der Reduzierer Wert „name, sum, key“

der zweite Job map-Verringerung verarbeitet die Ausgabe der ersten Karte-reduzieren Job und der dritten Datei, die eine Ausgabedatei, deren Format erzeugt, ist folgende -

id,key name,sum,price 

In der oben genannten, ist der Reduzierschlüssel "ID, Schlüssel" und der Reduzierer Wert ist "Name, Summe, Preis"

Verwandte Themen