Es ist wirklich verwirrend, dass jedes Google-Dokument für den Datenfluss sagt, dass es jetzt auf Apache Beam basiert und mich zur Beam-Website leitet. Auch wenn ich nach github-Projekt suchte, würde ich sehen, dass das google dataflow-Projekt leer ist und gerade alles zum Apache beam repo geht. Sag jetzt, ich muss eine Pipeline erstellen, von dem, was ich von Apache Beam gelesen habe, würde ich tun: from apache_beam.options.pipeline_options
Allerdings, wenn ich mit google-cloud-dataflow gehe, werde ich Fehler haben: no module named 'options'
, stellt sich heraus, ich sollte from apache_beam.utils.pipeline_options
verwenden. Also, sieht aus wie google-cloud-dataflow mit einer älteren Beam-Version und wird veraltet sein?google-cloud-dataflow vs apache-beam
Welche sollte ich wählen, um meine Dataflow-Pipeline zu entwickeln?