2016-12-22 6 views
0

Ich versuche, die CSV-Datei aus meinen hdfs aufzunehmen, um mit dem unten stehenden Befehl zu hive.Csv-Dateiaufnahme von HDFs zu Stock

create table test (col1 string, col2 int, col3 string) 
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES ("separatorChar" = ",","quoteChar" = "\"") 
stored as textfile; 

Aber ich bekomme immer noch doppelte Anführungszeichen in meiner Hive-Tabelle, also habe ich den folgenden Befehl ausprobiert.

alter table test 
set TBLPROPERTIES ('skip.header.line.count'='1','serialization.null.format' = ''); 

Aber immer noch doppelte Anführungszeichen. Was kann ich tun, um diese Anführungszeichen zu entfernen?

Antwort

0

Sie müssen den Speicherort der Datei angeben.
Zum Beispiel:
CREATE TABLE test (col1 string, col2 int, col3 string) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ("separatorChar" = ",") STORED AS textfile LOCATION 'hdfs://<your-data-node-address>:8020/hdfs/path/to/csv/files-dir';
Wenn ich die Tabelle auf diese Weise habe ich nicht Zitate auf den Werten in meiner Tabelle (die Quelle CSV-Datei hat) erstellen