Verteilung in Amazon Redshift - BTree oder Hash

Was verwendet Amazon Redshift, um Werte im Cluster zu verteilen: Hash oder BTree?Verteilung in Amazon Redshift - BTree oder Hash

Wenn beispielsweise mein Verteilungsschlüssel ein Datum im Format "yyyy-MM-dd" ist, werden zwei aufeinander folgende Tage auf demselben Knoten gespeichert (wenn Btree verwendet wird) oder wahrscheinlich auf verschiedenen Knoten (wenn Hash ist verwendet, wird dies wahrscheinlich der Fall sein)?

Danke

Quelle

2016-09-05 Srdjan Nikitovic

Intelligente Frage. Sie wissen, wie die meisten RDBMS funktionieren.

Es gibt keine B-Bäume.

Eine Hash-Funktion wird auf Ihren Verteilungsschlüssel angewendet, und das Ergebnis der Hash-Funktion bestimmt, welcher Slice Ihre Daten empfängt.

Es gibt keine Indizes im traditionellen Sinn des Wortes. Redshift verwendet Informationen in seinem "Superblock", um zu ermitteln, ob eine vollständige Tabellensuche für bestimmte Abfragen vermieden werden kann.

Für große Datensätze gibt es 4 Praktiken, die dramatisch Ihre Leistung verbessern:

Hinweis, was von fehlt meine Liste? Ja, ich habe keine Indizes gesagt. Redshift hat keine Indizes.

Quelle

2016-09-06 20:59:30 BigDataKid

Verteilung in Amazon Redshift - BTree oder Hash

Antwort

Verwandte Themen