Ich versuche, mein Modell zu erhalten, das tf.contrib.learn.Estimator
mit einer benutzerdefinierten Modellfunktion verwendet, um verteiltes Training durchzuführen.Verteilte benutzerdefinierte Modellfunktion für Estimator
Die Tensorflow documentation gibt an, dass Jobs (PS und/oder Worker) mit der Funktion tf.device
manuell im Modell platziert werden sollen. Diese Dokumentation bezieht sich jedoch auf die alte Art, das Modell zu deklarieren, ohne die Estimator
Klassen- und Modellfunktionen zu verwenden.
Ich habe einige information gefunden, die besagt, dass die neue Estimator
"die meisten der komplizierten verteilte Logik des Modelltrainings und der Auswertung behandelt". Bedeutet das, dass die verschiedenen workers/ps-Jobs immer noch manuell im Modell platziert werden müssen? Und wenn ja, gibt es eine Änderung in der Art, wie sie aus dem Code in der Tensorflow-Dokumentation deklariert werden sollen (d. H. Unter Verwendung von tf.device
)?
Estimator ist eine neue Ergänzung zu TF und scheint ein bisschen in Arbeit zu sein. Ich konnte keine Beispiele finden, die es für verteiltes Training verwenden. Wenn es Ihnen gelingt, es zum Laufen zu bringen, könnten Sie die Antwort hier aktualisieren, damit andere Leute es finden können –