Ich bin neu in der ORC-Datei. Ich bin durch viele Blogs gegangen, habe aber kein klares Verständnis davon bekommen. Bitte helfen und klären Sie die folgenden Fragen.Hadoop ORC-Datei - Wie es funktioniert - Wie Sie Metadaten abrufen
Kann ich Schema aus der ORC-Datei abrufen? Ich weiß in Avro, Schema kann abgerufen werden.
Wie es tatsächlich Schema-Evolution bietet? Ich weiß, dass nur wenige Spalten hinzugefügt werden können. Aber wie es geht. Die einzige, die ich kenne, erstellen orc-Datei durch Laden von Daten in die Hive-Tabelle, die Daten im Ork-Format speichern.
Wie funktioniert der ORC-Index? Was ich weiß ist für jeden Stripe Index wird beibehalten. Aber da die Datei nicht sortiert ist, hilft es, Daten in der Liste der Streifen nachzuschlagen. Wie hilft es, Streifen zu überspringen, während man nach den Daten sucht?
Der Index wird für jede Spalte beibehalten. Wenn ja, wird es dann nicht mehr Speicher verbrauchen?
Wie die ORC-Datei im Spaltenformat in die Hive-Tabelle passen kann, in der die Werte der einzelnen Spalten zusammen gespeichert werden. während die Hive-Tabelle Datensatz für Datensatz abruft. Wie werden beide zusammenpassen?