Ich habe tabulatorgetrennte Rohdaten, die ich als Textzeichenfolge in einer Hive-Tabelle gespeichert habe. Ich möchte in der Lage sein, die ersten, dritten, ..., x Felder zu erfassen und die Ergebnisse in einer anderen Tabelle mit Feldnamen meiner Wahl zu speichern. Zum Beispiel mit dem folgenden:Tab-getrennte Rohdaten, die als Textstring gespeichert sind, in die Hive-Tabelle konvertieren?
raw_table
:
Field1 Field2 Field3
01001 1 00-00-32-0-700-000.000
neue custID_pin
Hive Tabelle:
custID PIN
01001 00-00-32-0-700-000.000
Hier ist, was habe ich bisher:
DROP TABLE IF EXISTS custID_pin;
CREATE TABLE custID_pin AS
SELECT
[psuedocode: column1, column3, where columns are defined by the tab delimiter]
FROM raw_table;
Wie schreibe ich die Select-Anweisung, um die oben erwähnten gewünschten Ergebnisse zu erzielen, in der c ase einer tabulatorgetrennten Datei statt einer Datei mit fester Breite.