Ich habe eine Pipeline mit einer BigQuery-Tabelle als Senke. Ich muss einige Schritte genau ausführen, nachdem Daten in BigQuery geschrieben wurden. Zu diesen Schritten gehören das Ausführen von Abfragen für diese Tabelle, das Lesen von Daten aus dieser Tabelle und das Schreiben in eine andere Tabelle.Führen Sie einen Prozess genau nach BigQueryIO.write() -Operation
Wie erreicht man das Obige? Sollte ich eine andere Pipeline für die letztere erstellen, aber dann nach der ersten Pipeline aufrufen, werde ich ein anderes Problem annehmen.
Wenn keiner der oben genannten Schritte funktioniert, ist es möglich, einen anderen Datenflussjob (Vorlage) aus einer laufenden Pipeline aufzurufen.
Wirklich brauchen Hilfe mit diesem.
Danke.
Nur hinzufügen - Sie müssen nicht unbedingt eine andere Pipeline verwenden, um dies zu erreichen. Nachdem die erste Pipeline abgeschlossen ist ('pipeline.run(). WaitUntilFinish()'), können Sie einfach auf das BigQuery SDK zurückgreifen. Wir tun dies sehr in unseren Pipelines und das Muster funktioniert gut. https://stackoverflow.com/questions/44315157/perform-action-after-dataflow-pipeline-has-processed-all-data/44328850#44328850 –
@jkff Wie es funktioniert, wenn ich Vorlagen erstellen? Habe ich separate Vorlagen für die beiden Pipelines? Was wäre, wenn ich eine einzelne Vorlage erstellen möchte, die beide Pipelines ausführt? – rish0097
Dies ist mit Vorlagen leider nicht möglich. – jkff