Wie ein Schwein Datei auszuführen

Ich habe eine einfache CSV-DateiWie ein Schwein Datei auszuführen

Wenn ich versuche, einige Code über es auf diese Art und Weise auszuführen.

grunt> SET job.name 'this_and_that'; 
grunt> SET mapreduce.job.queuename adhoc; 
grunt> SET default_parallel 50; 
grunt> index_row = load 'nmbr.csv' as (number:int); 
grunt> dump index_row;

Ich bekomme das richtige Ergebnis.

(1) 
(2) 
(3) 
(4)

Aber wenn ich den Code in einer Datei speichern test.pig

SET job.name 'this_and_that'; 
SET mapreduce.job.queuename adhoc; 
SET default_parallel 50; 
index_row = load 'nmbr.csv' as (number:int); 
dump index_row;

Und versuchen Sie es auf diese Weise zu laufen.

$ pig -x mapreduce hdfs://nameservice1/user/evkuzmin/test.pig

Ich bekomme diese Nachricht.

17/01/11 16:14:14 INFO pig.ExecTypeProvider: Trying ExecType : LOCAL 
17/01/11 16:14:14 INFO pig.ExecTypeProvider: Trying ExecType : MAPREDUCE 
17/01/11 16:14:14 INFO pig.ExecTypeProvider: Picked MAPREDUCE as the ExecType 
2017-01-11 16:14:14,306 [main] INFO org.apache.pig.Main - Apache Pig version 0.16.0.2.5.0.0-1245 (rexported) compiled Aug 26 2016, 02:07:35 
2017-01-11 16:14:14,307 [main] INFO org.apache.pig.Main - Logging error messages to: /export/home/evkuzmin/pig_1484140454299.log 
2017-01-11 16:14:20,083 [main] INFO org.apache.pig.impl.util.Utils - Default bootup file /export/home/evkuzmin/.pigbootup not found 
2017-01-11 16:14:20,301 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://nameservice1 
2017-01-11 16:14:20,401 [main] INFO org.apache.pig.PigServer - Pig Script ID for the session: PIG-test.pig-b92d8d10-6d6c-4018-b55c-da85716c482b 
2017-01-11 16:14:21,549 [main] INFO org.apache.hadoop.yarn.client.api.impl.TimelineClientImpl - Timeline service address: http://hd-has011.vimpelcom.ru:8188/ws/v1/timeline/ 
2017-01-11 16:14:21,571 [main] INFO org.apache.pig.backend.hadoop.PigATSClient - Created ATS Hook 
2017-01-11 16:14:26,403 [main] INFO org.apache.pig.Main - Pig script completed in 12 seconds and 711 milliseconds (12711 ms)

ich versucht, Blick hier für die Fehler,

/export/home/evkuzmin/pig_1484140454299.log

aber die Datei nicht da war.

Quelle

2017-01-11 Eugene Cuz

Wo ist die Datei 'NMBR. csv' liegt? lokal oder HDFS? – franklinsijo

@fra Ich habe eine in hdfs hdfs: //nameservice1/user/evkuzmin/nmbr.csv und eine lokale hier /export/home/evkuzmin/nmbr.csv –

Legen Sie nicht Ihre Test.pig in hdfs Speicherort.

statt Lageänderungen lokaler test.pig Last machen:

SET job.name 'this_and_that'; 
SET mapreduce.job.queuename adhoc; 
SET default_parallel 50; 
index_row = load 'hdfs://nameservice1/user/evkuzmin/nmbr.csv' as (number:int); 
dump index_row;

dann test.pig Datei nur von den lokalen laufen, aber in MapReduce-Modus:

pig -x MAPREDUCE your/local/path/to/test.pig

Quelle

2017-01-11 13:54:56

Wie ein Schwein Datei auszuführen

Antwort

Verwandte Themen