Ich bin auf der Suche nach Ratschlägen, was die beste Praxis in Bezug auf Orchestrierung von Prozessen ist. Um etwas Zusammenhang gebe ich haben folgende Aufgaben orchestrieren:Azure Process Orchestration
- Scale-up Pool Azure Batch ausreichend Knoten
- ausführen benutzerdefinierte .NET-Code zu schaffen, die einen Server ruft eine Liste von Aufgaben abzurufen. Diese Aufgaben ändern sich täglich. Ordnen Sie diese Aufgaben dem Stapelpool zu.
- Führen Sie jede Aufgabe (benutzerdefinierter .NET-Code) im Stapelpool aus. Jede Aufgabe erstellt Daten in einem Azure-Speicherkonto.
- Verringern Sie den Stapelpool, da er nicht mehr benötigt wird.
- Starten/Vergrößern des Data Warehouse
- Bulk Importieren Sie die Daten in das Data Warehouse (eine Kombination aus PolyBase und BCP ist zu erwarten).
- Aggregieren Sie die Daten und erstellen Sie die Ausgabe in einem Azure Storage-Konto.
- Pause/Skalierung der Data Warehouse nach unten
Ich vergleiche derzeit Data Warehouse Runbooks die oben auszuführen.
Ich finde Runbooks sind sehr primitiv in Bezug auf ihre Visualisierung während Design und Laufzeit.
Ich finde, dass Data Warehouse ist visuell mehr appealing. Das Daten-Slicing scheint jedoch ein massiver Overkill zu sein. Ich möchte einfach, dass der Prozess um 8 Uhr jeden Morgen ausgeführt wird. Ich will nicht, dass es seit Tagen versucht zu experimentieren (wenn ich zum Beispiel die Vorlage ändere). Ich gehe davon aus, dass das Data Warehouse den Fehler besser bewältigen wird.
Gibt es andere Ansätze, die ich hier berücksichtigen/Empfehlungen?
Dank David
Vielen Dank für Ihre Antwort. Glücklich genug, die Gewohnheit .Net zu schreiben. Bevor ich dies als Antwort ansehe, gibt es außer Runbooks noch andere Alternativen zu Data factory, die für die Prozess-Orchestrierung gedacht sind? Ich mag die Scheiben Aspekt von Data Factory (vielleicht wegen mangelndem Verständnis), aber Sorgen über Probleme wie "nicht auf einem Sat/Sonne laufen", oder wenn ich eine Pipeline mit einem Startdatum in der Vergangenheit erstellen, es möchte alle vorherigen Daten auch laufen lassen ... wenn ich wirklich möchte, dass es heute startet (ich weiß, dass ich es mit dem richtigen Startdatum erstellen konnte, aber besorgt über die Änderung bestehender). – DavidReid
PowerShell ist dein Freund hier. Sie können Segmente bei Bedarf mit den ADF-Cmdlets überschreiben. –