0

Ich versuche, ein großes verteiltes Tensorflow-Modell auf Google Clouds ML-Engine auszuführen und habe Probleme zu verstehen, was tf.train.ClusterSpec gehen soll.Ausführen von verteilten Tensorflow auf Google Cloud ML-Engine ClusterSpec

Wenn Sie einen Job auf Google Cloud laufen Sie scale tier von BASIC auswählen, Standard_1, PREMIUM_1, BASIC_GPU oder CUSTOM, jede Sie Cluster Zugriff auf verschiedene Arten von zu geben. Ich kann jedoch die Namen/Adressen der Maschinen in diesen Clustern nicht finden.

Antwort

0

Bitte beachten Sie die Dokumentation und das Muster here. Sie sollten ClusterSpec mit der Umgebungsvariablen TF_CONFIG festlegen; z.B.

tf_config = os.environ.get('TF_CONFIG') 

    # If TF_CONFIG is not available run local 
    if not tf_config: 
    return run('', True, *args, **kwargs) 

    tf_config_json = json.loads(tf_config) 
    cluster = tf_config_json.get('cluster') 
    ... 
    cluster_spec = tf.train.ClusterSpec(cluster) 
+0

Danke, das ist genau das, was ich gesucht habe. – Miguel

Verwandte Themen