Ich habe irgendwo gelesen, dass Hadoop eine integrierte Unterstützung für die Komprimierung und Dekomprimierung hat, aber ich denke, es geht um die Ausgabe von Mappern (durch Festlegen einiger Eigenschaften)?Ist die Komprimierung/Dekomprimierung von GZIP-Daten in Hadoop/PIG transparent?
Ich frage mich, ob es bestimmte PIG Lade-/Speicherfunktionen gibt, die ich zum Lesen komprimierter Daten oder zum Ausgeben von Daten als komprimiert verwenden kann?
http://my.safaribooksonline.com/book/-/9781449317881/8dot-making-pig-fly/id2907215 gibt auch einige weitere Details über die Zwischenkompression –