Gibt es eine Möglichkeit, Pyspark-Skripts mit Garn-Cluster-Modus ohne Verwendung der Spark-Submit-Skript ausführen? Ich brauche es auf diese Weise, weil ich diesen Code in eine Django Web App integrieren werde.Pyspark auf Garn-Cluster-Modus
Wenn ich versuche, jedes Skript in Garn-Cluster-Modus laufen zu lassen ich die folgende Fehlermeldung anzeigt:
org.apache.spark.SparkException: Detected yarn-cluster mode, but isn't running on a cluster. Deployment to YARN is not supported directly by SparkContext. Please use spark-submit.
ich die sparkContext auf folgende Weise erstellen:
conf = (SparkConf()
.setMaster("yarn-cluster")
.setAppName("DataFrameTest"))
sc = SparkContext(conf = conf)
#Dataframe code ....
Dank