2017-07-18 3 views
1

Ich lerne Amazon Redshift. Sie wissen, dass es sich um einen sehr leistungsfähigen Speicher in der Cloud handelt, und arbeitet sehr schnell mit Daten, bei denen Aggregatoperationen erforderlich sind, da Daten spaltenweise gespeichert werden.Spalte Datenbank Abfragen in Amazon Redshift

Kann ich keine Beispielabfragen finden? Könnte jemand einige Beispiele für Aggregatabfragen, die auf Amazon Redshift laufen, mit mir teilen? Unterscheidet es sich von normalen Beziehungsdatenbankabfragen?

Antwort

4

Sie haben Recht - Amazon Redshift ist eine Kolumnar-Datenbank. Dies bedeutet, dass die Daten auf der Platte pro Spalte gespeichert werden, was Operationen auf einer Spalte sehr schnell macht. Wenn Sie beispielsweise die Umsatzspalte für einen bestimmten Wert in der Spalte Land hinzufügen, müssen Sie nur auf zwei Spalten und nicht auf alle Spalten in einer Tabelle zugreifen.

Weitere Vorteile sind, dass Daten in Redshift sind komprimierte (die gut mit dem säule Konzept funktioniert, weil jede Spalte ihre eigenen Komprimierungsverfahren verwendet basierend auf den Daten gespeichert) und die Tatsache, dass es sich um eine gruppierten Datenbank, So können Rechen- und Speicherkapazität durch Hinzufügen zusätzlicher Knoten skaliert werden.

Amazon Redshift präsentiert sich als PostgreSQL Datenbank, so dass Sie nur Industrie-Standard-SQL verwenden, um Daten abzufragen. Änderungen an Abfragen sind nicht erforderlich.

Sie können jedoch Redshift optimieren, indem sie mit Bedacht einen Verteilungsschlüssel für jede Tabelle auswählen, die festlegt, wie Daten zwischen Knoten verteilt wird, und sorgfältig wählen Sie die Sortierschlüssel, die bestimmt, wie Daten auf jedem Knoten gespeichert ist. Einfach gesagt, Daten sollten verteilt werden, wie Sie JOIN Tabellen und sollte nach dem, was Sie in WHERE Anweisungen verwenden sortiert werden.

Wie für Beispielabfragen ... es hängt völlig von Ihren Daten ab! Abfragen sehen genau das gleiche wie normal SQL.

Verwandte Themen