Ich habe einige Dateien in HDFS
in parquet
Format. Ich möchte diese Dateien in eine einzige große Datei zusammenführen.Mischen Sie zwei Parkett-Dateien in HDFS
Wie kann ich das tun?
Ich habe etwas wie unten aber für Textdateien getan.
hadoop fs -cat /input_hdfs_dir/* | hadoop fs -put - /output_hdfs_file
aber nicht in der Lage, das gewünschte Ergebnis in parquet
Format zu erreichen.
Wie kann ich meine Anforderung erfüllen?
Ich denke, 'Parkett-Tools 'kommt in diesen Tagen mit Cloudera vorinstalliert. – philantrovert