2017-05-02 7 views
0

Ich komponierte eine einfache verlassene Join hiveql Die Gesamtzahl der obigen Abfrage Ergebnis ist 798,608. Die Gesamtzahl der Datensätze in Tabelle a ist jedoch 780,499, was nicht übereinstimmt.Inkonsistente Hive Links Beitreten Ergebnisse

Ich habe versucht, alle Datensätze zu finden, die nur in den linken Join-Ergebnissen existieren, aber nicht in Tabelle a; Die Ergebnisse wurden leer angezeigt.

Ich habe sogar versucht, 2 kleine Tabellen (a 'und b') mit ein paar Datensätzen zu erstellen und die Anzahl der Links Join-Ergebnis entspricht der Anzahl der Tabelle a 'Datensätze, wie erwartet.

Was könnte die inkonsistenten Ergebnisse verursachen?

+3

meine Vermutung ist, Sie haben 1 zu viele Beziehung. Ihre Tabelle b enthält höchstwahrscheinlich mehrere Datensätze für einige Datensätze in Tabelle a. –

+3

Ich würde versuchen, eine Gruppe von Tabelle b für die Felder f1 und f2 und führen Sie eine Zählung auf, dann Tabelle b ohne eine Gruppe von durch und sehen, ob die Ergebnisse gleich sind. –

+0

@DavidLee, Sie sind richtig! Danke für die schnelle Abwicklung! – lovechillcool

Antwort

0

Dank an David Lee. Es gibt 1 zu viele Situationen in Tabelle b. Problem gelöst.