In Pig, ich habe die Anforderung, avail_until als nächste Datensätze 'avail_since gegeben eine bestimmte ID und Standard es 9999-12-31 für den letzten Datensatz von a gegebene ID. Ich beginne damit, die Daten per ID und dann Avail_Since zu bestellen, stehe aber danach fest. Ich denke, ich brauche vielleicht eine Über/Stich/Lead/Lag-Funktion, aber nicht sicher. Jede Hilfe würde sehr geschätzt werden!Apache PIG - setze das Datum der aktuellen Zeile als das Datum des nächsten Datensatzes
Input Data:
ID AVAIL_SINCE AVAIL_UNTIL
1 19-Jan-00 31-Dec-99
1 11-Jun-00 31-Dec-99
1 4-Aug-00 31-Dec-99
1 19-May-01 31-Dec-99
2 5-May-02 31-Dec-99
2 8-Apr-03 31-Dec-99
3 10-Jun-00 31-Dec-99
3 31-Oct-00 31-Dec-99
3 29-Dec-00 31-Dec-99
Required Result:
ID AVAIL_SINCE AVAIL_UNTIL
1 19-Jan-00 11-Jun-00
1 11-Jun-00 4-Aug-00
1 4-Aug-00 19-May-01
1 19-May-01 31-Dec-99
2 5-May-02 8-Apr-03
2 8-Apr-03 31-Dec-99
3 10-Jun-00 31-Oct-00
3 31-Oct-00 29-Dec-00
3 29-Dec-00 31-Dec-99