Während der Verwendung von Funken RDD, weiß ich, dass eine neue Bühne jedes Mal erstellt wird, wenn wir eine ShuffleRDD haben, aber ist eine neue Stufe erstellt, wenn wir mehrere Aktionen haben?Spark DAG Anzahl der Stufen
Beispiel:
val rdd1 = sc.textFile("<some_path").keyBy(x=>x.split(",")(1))
val rdd2 = sc.textFile("<some_path").keyBy(x=>x.split(",")(1))
val rdd3 = rdd1.join(rdd2)
rdd3.filter(x=><somecondition1>).saveAsTextFile("location1")
rdd3.filter(x=><somecondition2>).saveAsTextFile("location2")
Jetzt Stage1 Aufgaben RDD1, RDD2 und RDD3 bezogen haben, dann werden Stage2 haben sowohl die Aktionen speichern?