5
Sie fragen sich, warum die StatefulNetworkWordCount.scala Beispiel nennt die berüchtigte updateStateByKey() -Funktion, die eine Funktion nur als Parameter mit stattdessen nehmen soll:Funken Beispiel Streaming ruft updateStateByKey mit zusätzlichen Parametern
val stateDstream = wordDstream.updateStateByKey[Int](newUpdateFunc,
new HashPartitioner (ssc.sparkContext.defaultParallelism), true, initialRDD)
Warum die Notwendigkeit (und wie wird das verarbeitet - das ist nicht in der Signatur von updateStateByKey()?), um einen Partitionierer, einen booleschen und einen RDD zu übergeben?
Dank, Matt