Es wird versucht, Zeilen zu entfernen, in denen eine Spark-Datenrahmenspalte leere Zeichenfolgen enthält. Ursprünglich tat val df2 = df1.na.drop()
aber es stellt sich heraus, dass viele dieser Werte als ""
codiert werden.Entfernen leerer Zeichenfolgen aus einem Spark-Datenframe
Ich bin mit Spark 1.3.1 fest und kann auch nicht auf DSL verlassen. (Importieren von spark.implicit_ funktioniert nicht.)
Was möchten Sie mit leeren Zeichenfolgen tun? die Linie fallen lassen? – eliasah