Ich habe Daten wie folgt aus:Wie berechnet man den Datumsunterschied in pyspark?
df = sqlContext.createDataFrame([
('1986/10/15', 'z', 'null'),
('1986/10/15', 'z', 'null'),
('1986/10/15', 'c', 'null'),
('1986/10/15', 'null', 'null'),
('1986/10/16', 'null', '4.0')],
('low', 'high', 'normal'))
ich das Datum Unterschied zwischen low
Spalte und 2017-05-02
und ersetzen low
Spalte mit der Differenz berechnet werden soll. Ich habe verwandte Lösungen auf Stackoverflow versucht, aber keiner von ihnen funktioniert.
Ich habe einen Fehler „Typeerror: to_date() nimmt genau 1 Argument (2 gegeben) " –
Und was ist wenn Nan Wert in' Low' Spalte ist? –
das ist, weil Sie Spark verwenden <2.2 – mtoto