Was ist der Unterschied zwischen der Auswahl einer WHERE-Klausel und der Filterung in Spark? Gibt es Anwendungsfälle, in denen einer geeigneter ist als der andere? Wann verwende ichSpark - SELECT WHERE oder Filterung?
DataFrame newdf = df.select(df.col("*")).where(df.col("somecol").leq(10))
und wann ist
DataFrame newdf = df.select(df.col("*")).filter("somecol <= 10")
besser geeignet?