Kann mir jemand erklären, warum ich für diese beiden Ausdrücke unterschiedliche Ergebnisse erhalte? Ich versuche, zwischen zwei Terminen zu filtern:Filter für mehrere Bedingungen am Datenrahmen
df.filter("act_date <='2017-04-01'" and "act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
Ergebnis: 37M
vs
df.filter("act_date <='2017-04-01'").filter("act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
Ergebnis: 25M
Worin unterscheiden sie sich? Es scheint mir, als ob sie das gleiche Ergebnis
Danke, ich hätte eine einzelne SQL-Zeichenfolge wie oben beschrieben verwenden sollen. Ein Versehen meinerseits. – femibyte