Ich lerne jetzt, wie man Hadoop Pig jetzt benutzt.Hadoop Pig count Nummer
Wenn ich eine Eingabedatei wie folgt aus:
a,b,c,true
s,c,v,false
a,s,b,true
...
Das letzte Feld ist diejenige, die ich zählen müssen ... Also ich möchte wissen, wie viele ‚wahr‘ und ‚falsch‘ in dieser Datei .
Ich versuche:
records = LOAD 'test/input.csv' USING PigStorage(',');
boolean = foreach records generate $3;
groups = group boolean all;
Jetzt werde ich stecken. Ich möchte verwenden:
count = foreach groups generate count('true');"
Um die Anzahl der „true“ zu bekommen, aber ich bekomme immer die Fehlermeldung:
2013-08-07 16:32:36,677 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could not resolve count using imports: [, org.apache.pig.builtin., org.apache.pig.impl.builtin.] Details at logfile: /etc/pig/pig_1375911119028.log
mir jemand kann sagen, wo ist das Problem?
Dank, es funktioniert! – user2597504