2016-11-07 3 views
0

Ich bin wirklich neu zu Hive, ich entschuldige mich, wenn es Missverständnisse in meiner Frage gibt.Deserialize Protobuf Spalte mit Hive

Ich muss eine Hadoop-Sequenzdatei in eine Hive-Tabelle lesen, die Sequenzdatei ist Binärobjekt-Daten, die mit SerDe2, das mit Hive kommt, deserialisiert werden können.

Das Problem ist jetzt: Eine Spalte in der Datei ist mit Google Protobuf codiert, wenn SerDe Sparsamkeit verarbeitet die Sequenz-Datei verarbeitet es nicht die Protobuf-codierte Spalte ordnungsgemäß.

Ich frage mich, ob es einen Weg in Hive gibt, mit dieser Art von protobuf-kodierten Spalten umzugehen, die in einer Sparsamkeitssequenz-Datei verschachtelt sind, so dass jede Spalte richtig analysiert werden könnte?

Vielen Dank für jede mögliche Hilfe!

Antwort