Vielleicht ist dies gut dokumentiert, aber ich bin sehr verwirrt, wie man das macht (es gibt viele Apache-Tools).Wie konvertiert man eine 500GB SQL-Tabelle in Impala Parquet?
Wenn ich eine SQL-Tabelle zu erstellen, erstelle ich die Tabelle mit den folgenden Befehlen:
CREATE TABLE table_name(
column1 datatype,
column2 datatype,
column3 datatype,
.....
columnN datatype,
PRIMARY KEY(one or more columns)
);
Wie kann man convert diese Tabelle in Parkett gibt es? Diese Datei wird auf die Festplatte geschrieben? Wenn die Originaldaten mehrere GB betragen, wie lange muss man warten?
Könnte ich die ursprünglichen Rohdaten stattdessen in das Parquet-Format formatieren?
Für die Aufzeichnung hat Sqoop keine wirkliche Zukunft ist jetzt, dass Funken Dynamik als „general purpose gewinnen ETL-Engine für Hadoop und darüber hinaus "* (Sqoop wurde von Cloudera als Notlösung entwickelt, aber Cloudera setzt sich jetzt für Spark ein ...) * –