Ich habe eine Anforderung, Pivot auf unter Tabelle zu verwenden.Pivot in PYSPARKSQL
id,week,score
102,1,96
101,1,138
102,1,37
101,1,59
101,2,282
102,2,212
102,2,78
101,2,97
102,3,60
102,3,123
101,3,220
101,3,87
Ausgang
1 2 3
101 138,59 282,97 220,87
102 96,37 212,78 123,60
hier i sortieren müssen
Punkte Ich habe unten Code versucht, aber es funktioniert nur, wenn es einen einzelnen Datensatz auf einer bestimmten ID ist
df.groupBy("id").pivot("week").agg(first("score"))
Mögliche Duplikat von [Wie Datenrahmen schwenken?] (Https://stackoverflow.com/questions/30244910/how-to-pivot-dataframe) –
Nein shankar, hier erwarte ich alle Datensätze als Array. Überprüfen Sie bitte die erwartete Ausgabe. – LUZO