Ich habe die folgende Funktion udf in pyspark Dataframe. Der Code funktioniert gut, außer wenn myFun1('oldColumn')
null ist, möchte ich die Ausgabe als leere Zeichenfolge anstelle von null.pyspark/dataframe: Ersetze null durch Leerzeichen
myFun1 = udf(lambda x: myModule.myFunction1(x), StringType())
myDF = myDF.withColumn('newColumn', myFun1('oldColumn'))
Ist es möglich, dies an Ort und Stelle zu tun, anstatt eine andere udf-Funktion zu erstellen? Vielen Dank!