Ich habe einen Anwendungsfall, in dem ich auf mehrere Spalten gruppieren und auf einer bestimmten Spalte über Partitionen, die Teilmengen der Spalten in der group by
-Klausel sind, aggregieren.Einschränkungen mit analytischen Abfragen in Hive
Beispielszenario
Tabellenschema:
(id int, category1 string, category2 string, category3 string, value int)
Ich möchte die folgende Abfrage ausführen:
select sum(value) over (partition by category1) as c1_sum, sum(value) over (partition by category2) as c2_sum, sum(value) over (partition by category3) as c3_sum from <table_name> group by category_1, category2, category3;
jedoch hive beklagt, dass die Spalte value
nicht Teil der ist group by
Klausel.
Gibt es einen anderen Weg, dies im Bienenstock zu erreichen?
Alle Vorschläge würden sehr geschätzt werden. Vielen Dank!