2017-02-27 1 views
0

Ich lerne Apache Pig. Ich versuche einige Daten ins Schwein zu laden. Wenn ich die txt-Datei im Editor sehe, finde ich die folgende (Beispiel-) Zeile.Apache Pig - Numerische Daten beim Laden in einer Schwein-Relation fehlen

[ABBOTT, DEEDEE W Klasse 9-12 LEHRER 52,122.10 0 LBOE ATLANTA INDEPENDENT SCHOOL SYSTEM 2010].

Ich verwende den folgenden Befehl, um Daten in eine Pig-Relation zu laden.

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 

Allerdings, wenn ich einen Dump in Schwein in der verteilten Umgebung tun, finde ich das folgende Ergebnis (für die Zeile oben erwähnt):

(ABBOTT, DEEDEE W, Klasse 9-12 LEHRER ,, 0.0, LBOE, ATLANTA UNABHÄNGIG SCHULSYSTEM, 2010).

Die numerischen Daten "52,122.10 " scheinen zu fehlen.

Bitte helfen.

+0

was ist der Dateitrenner? Ist es tab? –

+0

Ja Murali, es ist Tab getrennt. – Nemichandra

+0

versuchen, laden mit PigStorage ('\ t') –

Antwort

0

PigStorage() ist eine integrierte Funktion in Schwein, die Datensatztrennzeichen als Argumente verwendet. hier seine Registerkarte -> \ t

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray, 
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int); 
+0

Danke für die Hilfe. Es hat gut geklappt. – Nemichandra

+0

@ Nemichandra: Sie können diese Antwort akzeptieren, wenn es geholfen hat. –