Kann Code in Google Cloud Datalab auf Dataproc-Clustern ausgeführt werden?Google Cloud Dataproc von Google Datalab
Die Idee ist, die große Interaktivität und Schnittstelle von Datalab zu verwenden, um Apache Spark Code auszuführen.
Kann Code in Google Cloud Datalab auf Dataproc-Clustern ausgeführt werden?Google Cloud Dataproc von Google Datalab
Die Idee ist, die große Interaktivität und Schnittstelle von Datalab zu verwenden, um Apache Spark Code auszuführen.
Dies ist auf unserem Radar, aber noch nicht vollständig als Init-Aktion für einen Dataproc-Cluster aktiviert.
Danke. Dinesh Kulkarni Produktmanager Datalab & Machine Learning, GCP
Nun ist es möglich, erstellen Sie einfach eine Dataproc Cluster diesem Befehl:
gcloud dataproc clusters create $CLUSTERNAME \
--project $PROJECT \
--num-workers $WORKERS \
--bucket $BUCKET \
--metadata startup-script-url=gs://$BUCKET/setup/setup_env.sh,BUCKET=$BUCKET \
--master-machine-type $VMMASTER \
--worker-machine-type $VMWORKER \
--initialization-actions \
gs://dataproc-initialization-actions/datalab/datalab.sh \
--scopes cloud-platform
Um es noch einfacher Sie dieses Skript verwenden können: https://github.com/kanjih-ciandt/script-dataproc-datalab/tree/master
Konnten Sie eine Antwort auf dieses erhalten oder ist datarab = dataproc + jupyter Notizbuch – mobcdi