2016-04-14 4 views
1

Ich habe eine verwaltete Hive-Tabelle erstellt, die als ORC gespeichert ist und beim Laden von .txt-Dateien funktioniert es gut, jedoch kann ich keine ORC-Datei in diese Tabelle laden. Gibt es etwas mit Trennzeichen zu tun? oder fehle ich etwas?Wie wird eine extern erstellte ORC-Datei in die als ORC gespeicherte HIVE-Tabelle geladen?

+0

Ihre Antwort ist nicht wirklich klar, ORC und Text ist definitiv nicht das gleiche Format. –

+1

Hallo, meine Frage war, ich habe eine ORC-verwaltete Tabelle im Bienenstock und bin nicht in der Lage, ORC-Dateien zu laden, die extern entsprechend dem Tabellenschema erstellt wurden. –

+0

Hat die externe ORC-Datei das gleiche Schema wie Ihre Hive-Tabelle? –

Antwort

1

Unten Code funktioniert für mich, während Laden von ORC-Dateien in HDFS in einer Hive-Tabelle.

  1. Erstellen Sie eine Tabelle im Bienenstock.

    create table MyDB.TEST (
    Col1 String, 
    Col2 String, 
    Col3 String, 
    Col4 String) 
    STORED AS INPUTFORMAT 
         'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
    OUTPUTFORMAT 
        'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'; 
    
  2. Daten in die Tabelle laden.

    LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST; 
    
Verwandte Themen