2017-11-30 2 views
0

Ich plane eine Spalte von Spark-Datenrahmen zu ändern ähnlichen Zweck der folgenden Hive QL zu implementieren:Wie implementieren „über (Partition nach Wert)“ mit Spark-Dataframe

SELECT Id, MIN(Id) over (PARTITION BY Age) Rep FROM Employees 

Meine Frage ist, wie zu implementieren "over (Partition von ..)" in UDF?

Mein Ruf ist wie folgt:

def _udfuntion = { ... } 
val ownfunc = udf(_udfunction) 
df.withColumn("Rep", ownfunc($"Id", $"Age")) 

Antwort

Verwandte Themen