Ich versuche Distributed Tensorflow auf einem EMR/EC2-Cluster auszuführen, aber ich weiß nicht, wie Sie verschiedene Instanzen im Cluster angeben, um Teile des Codes auszuführen.Wie wird TensorFlow in einem AWS-Cluster ausgeführt?
In der Dokumentation haben sie tf.device("/gpu:0")
verwendet, um eine GPU anzugeben. Aber was, wenn ich eine Master-CPU und 5 verschiedene Slave-GPU-Instanzen in einem EMR-Cluster habe und diese GPUs angeben möchte, um Code auszuführen? Ich kann tf.device()
mit den öffentlichen DNS-Namen der Instanzen nicht eingeben, da es einen Fehler gibt, der besagt, dass der Name nicht aufgelöst werden kann.