Redshift join mit varchar (40) und 2,3 Milliarden Zeilen

Ich bin neu bei Amazon Redshift. Der Versuch, den besten Weg zu finden, um zwei Tabellen in Rotverschiebung zu verbinden.
Ich habe 1 Tabelle mit 2,3 Milliarden Datensätze und die ID-Spalte hat den Datentyp varchar (40) mit Sortierschlüssel und Schlüssel.
Doing links mit anderen Tabelle mit 23 Millionen Datensätze auf der gleichen Spalte ID verbinden - Sortierschlüssel und dist Schlüssel.
Die Ausführung der Abfrage dauert Stunden. Was mache ich hier falsch?
Redshift join mit varchar (40) und 2,3 Milliarden Zeilen

Quelle

2016-08-09 Rahul Gupta

Sehen Sie, wenn Sie Warnungen für die Tabelle STL_ALERT_EVENT_LOG haben, können Sie auch 'EXPLAIN' für Ihre Abfrage verwenden und überprüfen, ob Ihre Abfrage den schnellsten Join verwendet (Merge Join). Sie sollten auch Tabellen mit Datenschräglauf oder unsortierten Zeilen identifizieren (siehe Redshift-Dokumentation)

Quelle

2016-08-10 12:26:19 opax

Vielen Dank! Ich habe "Explain" verwendet, um den Typ der Join-Abfrage zu bestimmen, der verwendet wurde, stellte sich heraus, dass es Hash-Join verwendete. Durchgeführtes Vakuum, das fast 10 Stunden gedauert hat und jetzt bekomme ich die Ergebnisse in 5 Minuten. –

Redshift join mit varchar (40) und 2,3 Milliarden Zeilen

Antwort

Verwandte Themen