Dies ist meine Funktion:Warum scheitert foreach-Operator mit NullPointerException bei Verwendung von Dataset?
def TestForeach(dataFrame: DataFrame)={
dataFrame.select("user_id").dropDuplicates().foreach(row =>{
dataFrame.filter("user_id == "+row.getString(0))
})
}
ich diesen Fehler:
ERROR Executor: Exception in task 2.0 in stage 4.0 (TID 16)
java.lang.NullPointerException
at org.apache.spark.sql.Dataset.filter(Dataset.scala:1318)
Wie Dataframes mit dem gleichen User_id zu bekommen?
Können Sie bitte die Ausnahme zu der Frage hinzufügen? Das würde es vollständiger machen. Vielen Dank! –