Wie implementieren „über (Partition nach Wert)“ mit Spark-Dataframe

Ich plane eine Spalte von Spark-Datenrahmen zu ändern ähnlichen Zweck der folgenden Hive QL zu implementieren:Wie implementieren „über (Partition nach Wert)“ mit Spark-Dataframe

SELECT Id, MIN(Id) over (PARTITION BY Age) Rep FROM Employees

Meine Frage ist, wie zu implementieren "over (Partition von ..)" in UDF?

Mein Ruf ist wie folgt:

def _udfuntion = { ... } 
val ownfunc = udf(_udfunction) 
df.withColumn("Rep", ownfunc($"Id", $"Age"))

2017-11-30 derek

Sie benötigen einen Benutzerdefiniert Aggregate Function (UDAF) zu verwenden, anstatt ein UDF.

2017-12-01 00:17:00 Nick

Antwort