Ich bin gespannt, was genau eine RDD an eine Funktion in Spark übergeben.Spark/Scala: RDD zu Funktion übergeben
def my_func(x : RDD[String]) : RDD[String] = {
do_something_here
}
Angenommen, wir definieren eine Funktion wie oben. Wenn wir die Funktion aufrufen und ein vorhandenes RDD [String] -Objekt als Eingabeparameter übergeben, macht diese my_function eine Kopie für diese RDD als Funktionsparameter? Mit anderen Worten: Wird es per Referenz oder Wert-by-Wert aufgerufen?