Ein Index ist nichts anderes als ein Zeiger auf eine bestimmte Spalte einer Tabelle. Einen Index erstellen bedeutet, einen Zeiger auf eine bestimmte Spalte einer Tabelle zu erstellen. Wenn eine Spalte in einer Tabelle indiziert ist und wie auf die Daten dieser bestimmten Spalte verwiesen wird, wenn diese bestimmte Spalte abgefragt wird?Wie funktioniert die Indexierung intern in der Struktur?
Antwort
Aus der Dokumentation
Das Ziel von Hive Indizierung ist die Geschwindigkeit der Abfrage-Lookup auf bestimmte Spalten einer Tabelle zu verbessern. Ohne einen Index laden Abfragen mit Prädikaten wie 'WHERE tab1.col1 = 10' die gesamte Tabelle oder Partition und alle Zeilen verarbeiten. Wenn jedoch ein Index für Spalte1 existiert, muss nur ein Teil der Datei geladen und verarbeitet werden. Die Verbesserung in Abfragegeschwindigkeit, die ein Index bereitstellen kann, wird auf Kosten von zusätzliche Verarbeitung zum Erstellen des Index und Speicherplatz zum Speichern des Index.
Hinter den Kulissen, Hive schafft im Wesentlichen eine Karte mit den Werten der Spalte, die es Indizierung sind und die Offset + Dateien, in denen die Daten im HDFS befinden, auf diese Weise, Hive braucht nicht alle zu scannen die Daten für die Suche nach einem bestimmten Wert. Hier ist ein guter Artikel, der die grundlegenden Konzepte erklärt
- 1. GDB Befehl für die Indexierung der Mitglieder einer Struktur
- 2. Wie funktioniert 'range()' intern?
- 3. Wie funktioniert SHLoadIndirectString() intern?
- 4. Wie funktioniert .SD intern?
- 5. Wie funktioniert Stringstream intern?
- 6. Wie funktioniert printf intern?
- 7. Wie funktioniert Firebug intern?
- 8. Wie funktioniert die Java-Serialisierung intern?
- 9. Wie funktioniert der Operator "ist" intern?
- 10. Hash: Wie funktioniert es intern?
- 11. Wie funktioniert PHP-PDO intern?
- 12. Wie funktioniert JS Promises intern?
- 13. Wie funktioniert ein Dienst intern in Android?
- 14. Wie funktioniert Gegendruck intern in RxJava
- 15. Wie speichert Java Strings und wie funktioniert der Teilstring intern?
- 16. C++: Funktionsvariable Deklarationen, wie funktioniert es intern?
- 17. Wie funktioniert intern im folgenden Code?
- 18. Räumliche Indexierung
- 19. Wie funktioniert phoneGap (Cordova) intern, iOS spezifische
- 20. jQuery each() - Wie funktioniert es wirklich intern?
- 21. Wie funktioniert getFragmentManager() intern bei Orientierungsänderung
- 22. Wie funktioniert PackagesToScan intern im Frühjahr?
- 23. Wie funktioniert der Google App Engine-Benutzerdienst intern?
- 24. Verbessert die Indexierung in Postgres die Bestellgeschwindigkeit?
- 25. Wie der HTML-Bericht in intern js
- 26. Externes Stylesheet funktioniert nicht (funktioniert aber intern)
- 27. Scanf in der Struktur, die "doppeltes" Array enthält, funktioniert nicht?
- 28. Wie funktioniert das Einfügen in Select intern in SQL Server?
- 29. Methode acceptAlert() funktioniert nicht in Intern/Leadfoot
- 30. Parameter Übergabe an die Partition funktioniert nicht in der Struktur