Ich habe eine Tabelle mit zwei Spalten: Produkt und Client. Ich muss alle Paare zwischen den Produkten erstellen und eine dritte Spalte mit der Anzahl der Kunden hinzufügen, die beide Produkte dieses Paares kaufen.sql redshift: Erstellen Sie Tabelle mit Paaren basierend auf einer Spalte Werte plus die Anzahl der Käufe (Ereignisse) jeder Kombination
Beispiel:
clients product
001 pants
001 shirt
001 pants
002 pants
002 shirt
002 shoes
ich brauchen würde, die Produkte in tuplas neu zu ordnen und eine dritte Spalte mit der Anzahl der Unique Clients, die die beiden Produkte gekauft hinzuzufügen. So vorherigen Beispiel wäre das Ergebnis:
product1 product2 count
pants shirt 2
pants shoes 1
shirt shoes 1
ich duplizierten Informationen vermeiden möchten. Zum Beispiel würde eine Zeile "Shirt Pants 2" nicht benötigt werden.
Würde jemand wissen, wie man das macht?
Danke!
Danke, aber in Ihrem ersten Beispiel auf t1.product = t2.product würde ich in einer Reihe gleiches Produkt. Meintest du auf t1.client = t2.client? – DroppingOff
Das bringt fast das zurück, was ich brauche. Das einzige, was fehlt, wäre die Bedingung, Duplikate zu vermeiden: Ich möchte doppelte Informationen vermeiden. Zum Beispiel würde eine Zeile "Shirt Pants 2" nicht benötigt werden. – DroppingOff