Was ist der Unterschied zwischen einem Sekundärindex und einem invertierten Index in Cassandra?

Als ich über diese beiden gelesen habe, dachte ich, beide erklären den gleichen Ansatz, ich googelte aber fand nichts. Ist der Unterschied in der Umsetzung? Cassandra macht den Sekundärindex selbst, aber invertierter Index muss von mir selbst implementiert werden?Was ist der Unterschied zwischen einem Sekundärindex und einem invertierten Index in Cassandra?

Was ist schneller bei der Suche, übrigens?

Quelle

2013-10-08 fereshteh

Der Hauptunterschied besteht darin, dass sekundäre Indizes in Cassandra nicht auf die gleiche Weise verteilt werden wie ein manueller invertierter Index. Mit den integrierten Sekundärindizes indiziert jeder Knoten die lokal gespeicherten Daten (mit dem LocalPartitioner). Bei der manuellen Indexierung werden die Indizes unabhängig von den Knoten verteilt, die die Werte speichern.

Dies bedeutet, dass für die integrierten Indizes jede Abfrage zu jedem Knoten gehen muss, während Sie bei umgekehrter Indexierung manuell zu einem Knoten (plus Replikaten) gehen würden, um den Wert abzufragen, den Sie gesucht haben. Ein Vorteil des lokalen Speicherns des Index besteht darin, dass Indizes mit den Daten atomar aktualisiert werden können. (Obwohl seit Cassandra 1.2 stattdessen die atomaren Batches verwendet werden könnten, obwohl sie etwas langsamer sind.)

Aus diesem Grund werden Cassandra-Indizes nicht für wirklich hohe Kardinalitätsdaten empfohlen. Wenn Sie auf jedem Knoten eine Suche durchführen, aber es nur ein oder zwei Ergebnisse gibt, ist dies ineffizient und ein manueller invertierter Index ist besser. Wenn Ihr Lookup viele Ergebnisse liefert, müssen Sie trotzdem auf jedem Knoten nachsehen, damit die eingebauten Indizes gut funktionieren.

Ein weiterer Vorteil der Verwendung der integrierten Indizierung von Cassandra besteht darin, dass die Indizes nur langsam aktualisiert werden, sodass Sie nicht bei jedem Update einen Lesevorgang durchführen müssen. (Siehe CASSANDRA-2897.) Dies kann eine erhebliche Geschwindigkeitsverbesserung für indizierte Tabellen mit hohem Schreibdurchsatz sein.

Quelle

2013-10-08 14:24:40 Richard

Inspiriert von dieser Frage schrieb ich eine ausführlichere Antwort auf meinem Blog: www.wentnet.com/blog/?p=77 – Richard

die Ironie eines Datenbankverbindungsfehlers – devshorts

Was ist der Unterschied zwischen einem Sekundärindex und einem invertierten Index in Cassandra?

Antwort

Verwandte Themen