Ich komponierte eine einfache verlassene Join hiveql Die Gesamtzahl der obigen Abfrage Ergebnis ist 798,608
. Die Gesamtzahl der Datensätze in Tabelle a ist jedoch 780,499
, was nicht übereinstimmt.Inkonsistente Hive Links Beitreten Ergebnisse
Ich habe versucht, alle Datensätze zu finden, die nur in den linken Join-Ergebnissen existieren, aber nicht in Tabelle a; Die Ergebnisse wurden leer angezeigt.
Ich habe sogar versucht, 2 kleine Tabellen (a 'und b') mit ein paar Datensätzen zu erstellen und die Anzahl der Links Join-Ergebnis entspricht der Anzahl der Tabelle a 'Datensätze, wie erwartet.
Was könnte die inkonsistenten Ergebnisse verursachen?
meine Vermutung ist, Sie haben 1 zu viele Beziehung. Ihre Tabelle b enthält höchstwahrscheinlich mehrere Datensätze für einige Datensätze in Tabelle a. –
Ich würde versuchen, eine Gruppe von Tabelle b für die Felder f1 und f2 und führen Sie eine Zählung auf, dann Tabelle b ohne eine Gruppe von durch und sehen, ob die Ergebnisse gleich sind. –
@DavidLee, Sie sind richtig! Danke für die schnelle Abwicklung! – lovechillcool