theoretische Frage,Impala GROUP BY partitioniert Spalte
Lets sagen, ich habe Tabelle mit vier Spalten: A, B, C, D. Werte von A und D sind gleich, Tabelle ist durch Spalte A partitioniert.
Leistung weise würde es einen Unterschied machen, wenn ich diese Abfrage SELECT SUM (B) GROUP BY A; oder diese: SELECT SUM (B) GROUP BY D;
In anderen Worten frage ich, gibt es irgendeine Leistungssteigerung durch die Verwendung der GROUP BY auf partitionierte Spalte?
Dank