Ich plane eine Spalte von Spark-Datenrahmen zu ändern ähnlichen Zweck der folgenden Hive QL zu implementieren:Wie implementieren „über (Partition nach Wert)“ mit Spark-Dataframe
SELECT Id, MIN(Id) over (PARTITION BY Age) Rep FROM Employees
Meine Frage ist, wie zu implementieren "over (Partition von ..)" in UDF?
Mein Ruf ist wie folgt:
def _udfuntion = { ... }
val ownfunc = udf(_udfunction)
df.withColumn("Rep", ownfunc($"Id", $"Age"))