Ich möchte die Zelle Werte einer Dataframe-Spalte (Alter) ändern, wo derzeit leer ist und ich würde es nur tun, wenn eine andere Spalte (Survived) den Wert 0 für die entsprechende Zeile hat wo es für Age leer ist. Wenn es in der Survived-Spalte 1 ist, aber in der Age-Spalte leer ist, behalte ich es als null.Pyspark: mehrere Bedingungen in When-Klausel
Ich habe versucht, &&
Operator zu verwenden, aber es hat nicht funktioniert. Hier ist mein Code:
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
Irgendwelche Vorschläge, wie man damit umgeht? Vielen Dank.
Fehlermeldung:
SyntaxError: invalid syntax
File "<ipython-input-33-3e691784411c>", line 1
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
^