Ich habe kürzlich einen Spark-Cluster in Google Cloud Dataproc mit dem Vorschaubild gestartet. Laut der Dokumentation ist die Spark-Version des Vorschaubilds '2.1.0', jedoch zeigt spark-shell --version
, dass der Cluster tatsächlich Spark 2.2.0 ausführt. Dies ist ein Problem für uns, da unsere Version spark-avro
nicht mit Spark 2.2.0 kompatibel ist. Hat noch jemand dieses Problem? Ich habe keine Spur einer offiziellen Ankündigung von Google bezüglich des Versions-Bums gefunden.Wurde die Spark-Version des Google Cloud Dataproc-Vorschaubilds geändert?
Antwort
Entschuldigung, es scheint, dass die Minor Release Notes für das aktuelle preview
Image-Update im Ether verloren gegangen sind; Die Dokumentation sollte hoffentlich bis morgen aktualisiert werden. In der Tat haben Sie Recht, dass die aktuelle Dataproc preview
Version jetzt Spark 2.2.0 ist. Wenn Sie an ein bekanntes funktionierendes älteres Vorschaubild anpinnen müssen, können Sie Folgendes versuchen:
gcloud dataproc clusters create --image https://www.googleapis.com/compute/v1/projects/cloud-dataproc/global/images/dataproc-1-2-20170227-145329
Das sollte Spark 2.1.0 enthalten. Beachten Sie jedoch, dass es im Allgemeinen immer möglich ist, dass inkompatible Änderungen an neuen Vorschaubildern vorgenommen werden, und dass das Pinnen auf dieses ältere Vorschaubild nicht garantiert ist, dass es langfristig weiter funktioniert.
In Ihrem Fall, wissen Sie zufällig, ob Sie diese issue filed on spark-avro schlagen oder ist es etwas spezifisch für Ihre Version? Im Idealfall sollten wir Sie auf Spark 2.2 updaten, da mit Spark 2.2 eine offizielle (nicht Vorschau) Image-Version bevorsteht.
- 1. Wie kann die Region des Google Cloud Platform-Projekts geändert werden?
- 2. Google Cloud Messaging - Nachrichten manchmal nicht bis Netzwerkstatus empfangen geändert
- 3. Verwenden des Dienstkontos mit google cloud dataflow
- 4. Verschieben des Google Cloud SDK-Verzeichnisses
- 5. Google Cloud Endpoints mit Google Cloud-Funktionen
- 6. kann Sparkcontext in Sparkversion 2.0.1 nicht erstellen
- 7. Google Cloud Pub/Sub zu Datastax Cassandra (In Google Cloud)
- 8. Hochladen des verschlüsselten Word-Dokuments in den Google Cloud-Speicher
- 9. Wurde die Control.Monad.State-API kürzlich geändert?
- 10. Google Cloud Storage-Weitergabe
- 11. Google Cloud-Dienstkonto nicht gefunden
- 12. Egit und Google Cloud
- 13. Google Cloud Datastore vs Cloud SQL
- 14. Google Cloud-Statusprüfung mithilfe der REST-API?
- 15. erkennen, ob etwas geändert wurde
- 16. Wie kann die Datenbankversion einer Google Cloud SQL-Instanz (Second Gen) geändert werden?
- 17. Zeichnungsposition wurde in PrintPageEventArgs.Graphis geändert
- 18. Erlaubnis in Google Cloud SFTP
- 19. Warten bis der Text des Elements in WebdriverJS geändert wurde?
- 20. Google Cloud-Funktion: Unterstützung für Google Cloud KMS
- 21. google cloud hosting für die datenbank
- 22. Wie verwenden Sie die Google Cloud Platform?
- 23. Wie ändert man die Google Cloud-Funktionszone?
- 24. Inhaltsklassifizierung API für die Google Cloud?
- 25. Unterstützt Google Cloud Spanner die Komprimierung?
- 26. Warum wurde die Eigenschaft INSTALLFOLDER nicht über die RadioButtonGroup geändert?
- 27. Google Cloud Bigtable: Abfrage Teilschlüssel
- 28. Benutzerdefinierte Google Cloud Platform-Domänen
- 29. Google Cloud Platform - Datenverteilung
- 30. Google Cloud Datastore-Stapeloperationssequenz
Vielen Dank für die Antwort, Dennis. Wir treffen das verlinkte Problem auf Spark-Avro. Ich möchte auf 2.2.0 upgraden, sobald das Problem behoben ist. Wir verwenden die von Ihnen in der Zwischenzeit vorgeschlagene Problemumgehung. Freue mich schon auf die offizielle Bildveröffentlichung! – mjaz
Vielen Dank für die Bestätigung des Problems! Wir werden die Spark-Avro-Korrektur, die bereits in Arbeit ist, genau im Auge behalten: https://github.com/databricks/spark-avro/pull/242 –