Ich bin ein wenig verloren, wie dies zu tun ist. Ich implementiere die Summenfunktion MADlib. Diese Funktion nimmt eine beliebige Anzahl von Arrays und fügt hinzu:Summe MADlib UDF Spark SQL
sum (array [ 1,2] , array [2,3 ] , array [4,5 ])
Return : [7,10]
ich von der nächsten Anweisung eine Funktion erstellen möchten, um das gleiche Ergebnis zurück, aber nicht, wie so etwas zu implementieren:
def sum[T](args: WrappedArray[T]*)(implicit n: Numeric[T]) = {
var i : Int = 0;
for(arg <- args){
// Code
i = i + 1;
}
}
sqlContext.udf.register("sum", sum(_:WrappedArray[Int]*))
sqlContext.sql("SELECT sum(collect_list(a),collect_list(b),collect_list(c)) from df").show
Ist diese Frage gelöst? – slouc