Beim Erstellen eines Airflow dag gebe ich normalerweise einen einfachen Zeitplan an, der regelmäßig ausgeführt werden soll - ich erwarte, dass dies die gebräuchlichste Verwendung ist.Wie kann ich die geplante Zeit für Aufholaufträge in Airflow abrufen?
dag = DAG('my_dag',
description='this is what it does',
schedule_interval='0 12 * * *',
start_date=datetime(2017, 10, 1),
catchup=False)
Ich muss dann das 'Datum' als Parameter in meinem tatsächlichen Prozess verwenden, also überprüfe ich nur das aktuelle Datum.
date = datetime.date.today()
# do some date-sensitive stuff
operator = MyOperator(..., params=[date, ...])
Mein Verständnis ist, dass catchup=True
Einstellung wird Airflow für jeden Zeitplan Intervall zwischen start_date
meine dag planen und jetzt (oder end_date
); z.B. jeden Tag.
Wie bekomme ich die scheduled_date
zur Verwendung in meiner dag-Instanz?
Perfekt. In meinen Augen ist das "Ausführungsdatum" der Zeitpunkt, zu dem die Aufgabe tatsächlich ausgeführt wird, was immer "jetzt" ist, aber das macht Sinn und funktioniert. –