Ich möchte eine Spalte mit einer zufällig generierten ID zu meinem Spark-Datenrahmen hinzufügen. Um dies zu tun, ich bin mit einem UDF UUID des zufälligen UUID-Methode aufrufen, etwa so:Spark erstellen UDF, die nicht Eingabe
def getRandomId(s:String) : String = {
UUID.randomUUID().toString()
}
val idUdf = udf(getRandomId(_:String))
val newDf = myDf.withColumn("id", idUdf($"colName"))
Offensichtlich meine getRandomId Funktion nicht einen Eingabeparameter benötigt; Ich kann jedoch nicht herausfinden, wie eine UDF erstellt wird, die keine Spalte als Eingabe akzeptiert. Ist das in Spark möglich?
Ich bin mit Funken 1,5
Möglich Duplikat der UDF-Funktion [Scala und Spark] (http://stackoverflow.com/questions/38633216/scala-and-spark-udf-function) – Yaron