2017-10-22 3 views
0

Ich habe zwei CSV-Dateien zwei Beziehungen in den Schweinen verbinden:Wie mit mehreren Feldern

1- Fertiltiy.csv:

enter image description here

2- Leben Expectency.csv:

enter image description here

ich möchte, dass sie in der Schweinemast verbinden, so dass das Ergebnis wird so sein:

enter image description here

ich Schwein neu bin, konnte ich nicht die richtige Antwort bekommen, aber hier ist mein Code:

fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 

lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by country, lifeExpectency by country; 

B = JOIN fertility by year, lifeExpectency by year; 

C = UNION A,B; 

DUMP C; 

Hier ist das Ergebnis meines Code:

enter image description here

Antwort

1

Sie haben den Beitritt nach Land und Jahr und wählen die notwendigen Spalten für Ihre endgültige Ausgabe.

fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 
lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by (country,year), lifeExpectency by (country,year); 
B = FOREACH A GENERATE fertility::country,fertility::year,fertility::fertility,lifeExpectency::lifeExpectency; 
DUMP B; 
+0

Danke, es hat funktioniert. Ersetzen Sie einfach DUMP C durch DUMP B, so kann ich es als eine richtige Antwort akzeptieren. –

+0

@AliZuhair aktualisiert. Vielen Dank im Voraus für die Annahme. –

Verwandte Themen