2016-11-24 3 views
0

Ich habe tabulatorgetrennte Rohdaten, die ich als Textzeichenfolge in einer Hive-Tabelle gespeichert habe. Ich möchte in der Lage sein, die ersten, dritten, ..., x Felder zu erfassen und die Ergebnisse in einer anderen Tabelle mit Feldnamen meiner Wahl zu speichern. Zum Beispiel mit dem folgenden:Tab-getrennte Rohdaten, die als Textstring gespeichert sind, in die Hive-Tabelle konvertieren?

raw_table:

Field1 Field2 Field3 
01001 1  00-00-32-0-700-000.000 

neue custID_pin Hive Tabelle:

custID PIN 
01001 00-00-32-0-700-000.000 

Hier ist, was habe ich bisher:

DROP TABLE IF EXISTS custID_pin; 
CREATE TABLE custID_pin AS 
SELECT 
[psuedocode: column1, column3, where columns are defined by the tab delimiter] 
FROM raw_table; 

Wie schreibe ich die Select-Anweisung, um die oben erwähnten gewünschten Ergebnisse zu erzielen, in der c ase einer tabulatorgetrennten Datei statt einer Datei mit fester Breite.

Antwort

0

so etwas wie das?

DROP TABLE IF EXISTS custID_pin; 
CREATE TABLE custID_pin row format delimited fields terminated by '\t' STORED AS TEXTFILE AS select column1, column3 from raw_table where columns1="value"; 
Verwandte Themen