Ich fand, dass Funken RDD.fold und scala List.fold mit derselben Eingabe unterschiedlich verhalten.Ist spark RDD.fold Methode Buggy?
Scala 2.11.8
List(1, 2, 3, 4).fold(1)(_ + _) // res0: Int = 11
Ich denke, die korrekte Ausgabe ist da 1 + (1 + 2 + 3 + 4) gleich 11. Aber entfachen RDD.fold Buggy sieht.
Spark-2.0.1 (nicht geclusterten)
sc.parallelize(List(1, 2, 3, 4)).fold(1)(_ + _) // res0: Int = 15
Obwohl RDD ist keine einfache Sammlung, ist dieses Ergebnis nicht sinnvoll. Ist das ein bekannter Fehler oder ein normales Ergebnis?
@ Shankar danke! Ich hätte mehr vor dieser Frage suchen sollen ... – jyshin