Ich habe einen Python beam.DoFn, der eine Datei ins Internet hochlädt. Dieser Prozess verwendet 100% eines Kerns für ~ 5 Sekunden und fährt dann mit dem Hochladen einer Datei für 2-3 Minuten fort (und verwendet einen sehr kleinen Bruchteil der CPU während des Uploads).Optimiert Google Cloud Dataflow die IO-gebundenen Prozesse?
Ist DataFlow intelligent genug, um dies zu optimieren, indem mehrere DoFns in separaten Threads/Prozessen erstellt werden?