2017-06-28 2 views
0

Ich versuche, Daten durch Schwein zu erhalten. Es gibt> 8K Felder in der Datei, und ich wollte, dass die Top-10-Datensätze jeder Spalte wählen:Apache Pig Equivalent von Select *

Derzeit bin ich gerade die gesamte Tabelle zu laden und die Variablennamen buchstabieren, ist es ein Äquivalent zu SQL des select * from TABLE LIMIT 10; in Schwein?

Strombelastung data = load 'xsf://EXAMPLE/1' using SomePigLoader('2017-01-01','2017-01-03','ID1,ID2,ID3....')

Antwort

1

Yes.After Laden Verwendung LIMIT auf die Beziehung

data = load 'xsf://EXAMPLE/1' using SomePigLoader('2017-01-01','2017-01-03','ID1,ID2,ID3....'); 
data_top10 = LIMIT data 10; 
DUMP data_top10;