Ich mache gerade einige Datenexploration mit Hive und kann das folgende Verhalten nicht erklären. Angenommen, ich habe eine Tabelle (namens mytable) mit einem Feld master_id.HIVE select count (*) Nicht null gibt einen höheren Wert zurück als Select count (*)
Wenn ich die Anzahl der Zeilenanzahl ich
select count(*) as c from mytable
c
1129563
Wenn ich die Anzahl der Zeilen mit einem nicht null master_id zählen möchten, erhalte ich eine höhere Anzahl
select count(*) as c from mytable where master_id is not null
c
1134041
Zusätzlich wird die master_id scheint niemals null zu sein.
select count(*) as c from mytable where master_id is null
c
0
Ich kann nicht erklären, wie das Hinzufügen einer where-Anweisung die Anzahl der Zeilen erhöhen kann. Hat jemand einen Hinweis, dieses Verhalten zu erklären?
Dank
Was ist das Schema der Tabelle aussehen? – Kusalananda
bieten Sie Ihr Tabellenschema – Beginner