Hive-Version: 1.2.1Wie reduziere ich das Generieren von SQL-Dateien "Alter Table/Partition Concatenate" in Hive?
Konfiguration:
set hive.execution.engine=tez;
set hive.merge.mapredfiles=true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.tezfiles=true;
HQL:
ALTER TABLE `table_name` PARTITION (partion_name1 = 'val1', partion_name2='val2', partion_name3='val3', partion_name4='val4') CONCATENATE;
ich die HQL verwenden, um Dateien von bestimmten Tabelle/Partition zu verschmelzen. Nach der Ausführung befinden sich jedoch immer noch viele Dateien im Ausgabeverzeichnis. und ihre Größe sind weit weniger als 256000000. So, wie Sie die Anzahl der Ausgabedateien verringern.
BTW, verwenden MapReduce anstelle von Tez auch nicht funktioniert.
können Sie die Tabelle DDL? – SrinivasR