I-Daten, die bereits gruppiert ist und aggregiert, es sieht aus wie so:Pig: Get Top-n-Werte pro Gruppe
user value count
---- -------- ------
Alice third 5
Alice first 11
Alice second 10
Alice fourth 2
...
Bob second 20
Bob third 18
Bob first 21
Bob fourth 8
...
Für jeden Benutzer (Alice und Bob), möchte ich ihre oben abrufen n Werte (sagen wir 2), sortierte Terme von 'count'. So ist die gewünschte Ausgabe ich will, ist dies:
Alice first 11
Alice second 10
Bob first 21
Bob second 20
Wie kann ich das erreichen?
ausgezeichnet, danke! – Hoff
Limit garantiert nicht, dass Sie die Top-Datensätze erhalten. –
Die [docs] (https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#LIMIT) sagen, dass das Ausführen eines 'limit' nach der' 'Bestellung'' der Sammlung garantiert, dass Sie die Top-Aufnahmen –