I 2 Tabellen in HIVE zu verbinden versuchen mit ein Schlüssel und das Datum aus der Tabelle B und dievorheriges nächstes Datum Datensatz aus der Tabelle zum Zeitpunkt der Join A entspricht. Zum Beispiel: Im Folgenden sind die zwei Eingänge TabellenHive verbinden das Datum wiese Bild zu bekommen
<----------TABLE A-------------> <------------TABLE B------------>
A_id A_date changed_col B_id B_date B_value A_id
**** ****** *********** **** ****** ******* *****
A01 2017-03-20 ABC B01 2017-04-02 200 A01
A01 2017-04-01 XYZ B01 2017-04-04 500 A01
A01 2017-04-05 LLL B02 2017-04-07 900 A02
A02 2017-04-06 KKK B02 2017-04-30 800 A02
A02 2017-04-12 JJJ
Allerdings, wenn ich die Tabelle B JOIN mit der Tabelle A für das nächste niedrigste Datum in Tabelle A für den gleichen Schlüssel (A_Id) aussehen sollte. Unten ist die erwartete Ausgabetabelle:
B_id B_date A_id A_date changed_col B_value
**** ****** **** ****** *********** *******
B01 2017-02-04 A01 2017-01-04 XYZ 200
B01 2017-04-04 A01 2017-01-04 XYZ 500
B02 2017-04-07 A02 2017-04-06 KKK 900
B02 2017-04-30 A02 2017-04-12 JJJ 800
Jede Hilfe wird sehr geschätzt. Dank
Ist die Kombination von B_id und B_date eindeutig? –