Ich frage mich, wie das Verhalten von Spark im feinkörnigen Modus auf Mesos sein würde, wenn Cgroups aktiviert sind.Verhalten von Mesos bei Verwendung von Steuergruppen für Spark
Eine Sorge ist, wenn ich Mesos + Funken ohne cgroups verwende, zeigt es bereits, dass der tatsächliche Spark Executor-Prozess mindestens 10% mehr Speicher verwendet, als was es Mesos versprochen hat, es zu verwenden. Würden Sie die Spark-Executoren bei der Aktivierung von cgroups ausschalten?
Zweitens, wie wird Datei-Cache behandelt? Spark stützt sich stark auf den Dateicache. Wird der Datei-Cache auf die Speichermenge in Mesos angerechnet? Wahrscheinlich nicht, aber könnten wir das beeinflussen? Zum Beispiel möchte ich im Idealfall, dass Spark insgesamt 8 GB verwendet, von denen 5 GB für den Java-Prozess verwendet werden sollten - vorausgesetzt, dass Spark gut spielt und nicht über 5 GB hinauswächst - und 3 GB als File-Cache (max).
Ich hoffe, dass jemand Erfahrung damit hat, denn um diese Dinge selbst zu testen, müsste ich viele Supportanfragen von unserem Cluster sysadmin durchlaufen, da cgroups sich zu einem Zeitpunkt auf Root-Anmeldeinformationen verlassen würde - und ich würde hasse es, umsonst zu sein, ohne andere gefragt zu haben.