2017-01-25 1 views

Antwort

3

Es ist möglich, zusätzliche Maßnahmen zu vermeiden, mit broadcast mit Kreuzprodukt:

import org.apache.spark.sql.functions.broadcast 

df.crossJoin(broadcast(df.agg(avg("date")))) 

oder:

spark.conf.set("spark.sql.crossJoin.enabled", true) 

df.join(broadcast(df.agg(avg("date")))) 

Was Sie sollten nicht tun wird mit Fensterfunktionen:

df.withColumn("avg", avg("date").over()) 

Verwandte Themen