Ich kenne mindestens 2 Möglichkeiten, meine Abhängigkeiten in einen Spark EMR Job zu bekommen. Eine besteht darin, ein Fat-Jar zu erstellen, und eine andere besteht darin, mit der Option --packages
anzugeben, welche Pakete in Spark übergeben werden sollen.Spark, Alternative zu Fettglas
Das Fettglas nimmt ziemlich viel Zeit in Anspruch. Ist das normal? ~ 10 Minuten. Ist es möglich, dass wir es falsch konfiguriert haben?
Die Befehlszeilenoption ist in Ordnung, aber fehleranfällig.
Gibt es Alternativen? Ich würde es gerne sehen, wenn es (schon vorhanden) eine Möglichkeit gäbe, die Abhängigkeitsliste in das Jar mit Gradle einzubinden, dann lade sie herunter. Ist das möglich? Gibt es andere Alternativen?
Update: Ich poste eine Teilantwort. Eine Sache, die ich in meiner ursprünglichen Frage nicht klar gemacht habe, war, dass ich auch kümmern, wenn Sie Abhängigkeitskonflikte haben, weil Sie das gleiche Glas mit verschiedenen Versionen haben.