In Spark-Sql Version 1.6, mit DataFrame
s, gibt es eine Möglichkeit, für eine bestimmte Spalte die Summe der aktuellen Zeile und die nächste Zeile für jede Zeile zu berechnen?Wie berechnet man die aktuelle Zeile mit der nächsten?
Zum Beispiel, wenn ich eine Tabelle mit einer Spalte haben, wie so
Age
12
23
31
67
würde Ich mag die folgende Ausgabe
Sum
35
54
98
Die letzte Reihe fallen gelassen wird, weil es keine „nächste hat Zeile "hinzugefügt werden.
Im Moment mache ich es, indem ich die Tabelle rangiere und sie mit sich selbst verbinde, wo rank
gleich rank+1
ist.
Gibt es einen besseren Weg, dies zu tun? Kann dies mit einer Window
Funktion gemacht werden?
Verwenden Sie 'Window.currentRow' anstatt –
Danke. Könnten Sie sich bitte auch [diese Frage] (https://stackoverflow.com/q/44392754/416300) ansehen? – summerbulb