Wir haben einen multinode Cluster zum Testen der Spark-Anwendung mit 4 Knoten eingerichtet. Jeder Knoten verfügt über 250 GB RAM, 48 Kerne. Master auf einem Knoten und 3 als Slaves ausführen.Wie können wir die Ausführungsparameter für eine Apache Funke-Anwendung setzen
Und wir haben eine Funken-Anwendung mit Scala entwickelt. Wir verwenden die Spark-Submit-Option, um den Job auszuführen. Jetzt ist hier der Punkt, den wir getroffen haben und weitere Erläuterungen benötigen, um fortzufahren.
Abfrage 1: Welches ist die beste Option, um einen Funkenauftrag auszuführen. a) Funken als Master b) Garn als Master und der Unterschied.
Abfrage 2: Während jeden Funken Job ausgeführt wird, können wir Option wie die Anzahl der Vollzieher liefern, keine Kerne, Testamentsvollstrecker Speicher usw.
Könnten Sie bitte beraten, was der optimale Wert für diese Parameter für eine bessere Leistung wäre in meinem Fall.
Jede Hilfe wäre sehr geschätzt werden, da es für jeden nützlich sein würde, der mit Funken beginnt :)
Danke. !!
Im Hinblick auf optimale Werte, es ist eine subjektive Sache. Lesen Sie diesen zweiteiligen Artikel - https://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-1/ – Pushkr