Vielen Dank für die Freigabe der Job-ID. Aus den Stackdriver-Protokolle, wie ich sehe, dass Arbeiter VMs Start nicht gestartet becuase sie den Behälter Bild holen von Docker nicht in der Lage waren:
Handler for GET /v1.23/images/dataflow.gcr.io/v1beta3/beam-java-batch:beam-0.6.0/json returned error: No such image: dataflow.gcr.io/v1beta3/beam-java-batch:beam-0.6.0
EDIT: Nach einer weiteren Inspektion, kann ich sehen, es gibt keine inszenierten Gläser für die Arbeit. Es scheint, dass die stagingFiles mit nur einer CSV-Datei überschrieben werden: header_H-[..].csv
.
Wenn Sie die Option getFilesToStage()
angeben, müssen Sie auch die vollständige Liste der JAR-Dateien einschließen, die für die Ausführung Ihrer Pipeline erforderlich sind. Sie können sehen, wie die DataflowRunner
dies in detectClassPathResourcesToStage(classLoader)
tut.
Als Nebenwirkung wird unter Verwendung dieser Pipeline den Datenfluss SDK 0.6, die derzeit veraltet. Die neueste 1.x-Version ist 1.9.1, oder Sie können auf 2.1.0 aktualisieren, die auf Apache Beam basiert.
Job ID: 2017-09-11_07_13_42-2005096921586938573 – bignano