Ich frage mich, ob es irgendeinen Grund gibt, warum der Funke Job, den ich in Zepplin Absatz schrieb, viel schneller als das Ausführen von Spark-submit selbst ausgeführt wird?Apache Zepplin Funke Job läuft schneller als Spark-submit
Ich benutze grundsätzlich die gleiche Konfiguration (Executoren, Speicher) in Zepplin und spark-submit, aber es gibt so viel signifikanten Unterschied in der Ausführungszeit.
Beide laufen auf dem gleichen eigenständigen Funkencluster.
Was kann diesen Unterschied erklären?
Wie lautet der Code des Jobs? –
@ T.Gawęda Ich glaube nicht, dass es der Code ist, ist es wahrscheinlich, weil ich Zepplin Funke Kontext (sc) verwenden, sqlContext, die von meiner Spark Conf abweichen kann –
Sind Sie für Startup/Shutdown-Zeit? Ich kann mir vorstellen, dass die Zeppelin-Instanz bereits läuft, daher gibt es keine Startzeit. Wenn Sie nicht bereits versuchen, interne Scala Timing –