Hortonworks HDP 2.3.0 - Nest 0,14Bienenstock linken äußeren lang join Lauf
Tabelle T1 (Partition auf spalte1, keine Eimer, ORC) ca. 120 Millionen Zeilen & 6 GB Datasize Tabelle T2 (Partition auf Col2, keine Eimer , ORC) ca. 200 M Zeilen & 6 MB Datasize
T1 auf T2 linken äußeren join (t1.col3 = t2.col3)
die obige Abfrage ist in der letzten Reduktionsphase in sowohl tez & mr Modus langer Lauf . Ich habe auch versucht, automatisch zu konvertieren True/False & explizite Mapjoin.
Noch läuft die Abfrage in der letzten Reduziererphase, niemals endend.
FYI - Wenn die Datengröße von T2 entweder 9k oder 1GB ist, wird die Abfrage beendet.
Um. Einige weitere Verben und erklärender Text wären nett. Die Frage ist eher schwer zu verstehen. –
Ich versuche, linken äußeren Join mit großen Tisch (6 GB) gegen kleine Tabelle (6 MB) durchzuführen. Im tez & mr-Modus endet dieser linke äußere Join niemals. Bei jeder Konfiguration (auto convert true/auto convert false) bleibt die Ausführung in der letzten Reduzierstufe des MapReduce Job/TEZ-Jobs hängen. –