Die Beispieldaten, die Sie haben, haben nicht das richtige Format. Ihre Ladeanweisung verwendet ',' als Feldtrennzeichen. Die Tupel in der Tüte sind jedoch ebenfalls durch 'getrennt' und die Daten werden daher nicht korrekt geladen .
Eine Möglichkeit, dies zu beheben, ist ein anderes Trennzeichen für die Felder zu wählen.Zum Beispiel Tabulator, Pipe, Semikolon.
Verwendung von Tabs als Feldtrennzeichen und das Komma als Tupel Separator
10 1 {(2,4),(5,6)}
10 3 {(1,3),(6,9)}
Script für Tabulator getrennte Felder mit dem Schema
A = LOAD 'test8.txt' using PigStorage('\t') AS (f1:int, f2:int, B:bag{T:tuple(t1:int,t2:int)});
DUMP A;
Ausgabe
Alternativ können Sie Laden Sie die Beispieldaten ohne Spezifische die Felder ying
10,1,{(2,4),(5,6)}
10,3,{(1,3),(6,9)}
Script für Last ohne Schema, aber mit '' als Feldtrenn
A = LOAD '/test8.txt' USING PigStorage(',');
DUMP A;
Ausgabe