Meine geplanten Fluss ist wie folgt:Talend - Ausgabe von tReplicate Subjob
subJob1
/
tOracleInput -> tMap -> tReplicate -- subJob2
\
subJob3
Die Idee ist, die DB nur einmal für diese große SQL-Ansicht abfragen, die Ausgabe zu replizieren und zu Teilaufträge übergeben, so kann es parallel bearbeitet werden. Um einen Überblick über das, was der Subjob tun würde:
componentToCatchOutputFromParent -> tMap -> tFileOutput
/
tOracleInput (query from view)
Was das bedeutet ist die SQL-view1 abfragen (für subjob1, verschiedene Ansichten für verschiedene Teilaufträge) (dies erwartet wird, sehr leicht Abfrage zu sein, die schwere Abfrage ist die von Parent, also Idee ist, die schwere Abfrage des Elternteils einmal auszuführen und wiederzuverwenden), verbinde diese mit der Ausgabe von dem Elternteil unter Verwendung eines Primärschlüssel-Fremdschlüsselkonzepts und gebe sie in eine Datei aus.
Zweck ist, zu versuchen, die Verarbeitung von Daten zu beschleunigen, indem die Datenbankaufrufe minimiert werden und die Generierung von Ausgabedateien parallel verarbeitet werden kann.
Das klingt wie ein Plan. Aber ich kann nicht umgehen, wie man die tReplicate Ausgabe vom Elternjob zum Subjob übergibt. Und in ähnlicher Weise, wie die Ausgabe von Eltern auf dem Unterjob zu fangen, so dass es möglich wäre, mit tMap beizutreten?
Alle Ideen werden sehr geschätzt.
Vielen Dank !!!