ich auf einer Streaming-Anwendung arbeite, die ich eine große RDD am Cachen (das nur im Speicher ist) ..einen großen Strom Caching
Dstream.cache()
Dstream.foreachRDD(..)
Dstream.foreachRDD(..)
ich nicht wissen wollte fit sein, wenn die DSTREAM kann in der Speicher .. Wird der RDD neu berechnet oder eine Ausnahme ausgelöst?
Ich stelle diese Frage, da ich mapwithState Funktion entwickle, die intern verwendet einen internen Strom eine Stateful-Anwendung verwendet, die nur im Speicher presisted wird. (https://github.com/wliuxad/spark/blob/master/streaming/src/main/scala/org/apache/spark/streaming/dstream/MapWithStateDStream.scala#L109-109)