0

Ich bin neu bei der ETL-Migration. Ich habe mit Talend zusammengearbeitet, war aber noch nicht mit der Aufgabe konfrontiert, große ETL-Projekte von einem Tool auf ein anderes zu migrieren (IBM Data Manager zu Informatica PowerCenter oder Informatica Developer).ETL-Toolmigration: Best Practices in Parallele Ausführung

Ich suche nach allgemeinen Richtlinien für die Migration von Jobs von einem Tool zu einem anderen, und natürlich für meinen speziellen Fall.

Ich werde mehr klar:

Die Datenbanken Quellen und Targes werden die gleichen sein, was muss ich ist Teil selbst die ETL migrieren.

Der Ansatz wird die parallel laufen, wie in diesem Blog vorgeschlagen:

Parallel Run

In meinem Fall habe ich nicht die ganze DWH stattdessen nur die ETL als die alte Software zu migrieren wird man ein Vermächtnis geworden und das neue ist von einem anderen Hersteller (glücklicherweise können beide XML exportieren).

Ich bin auf der Suche nach dem praktischen Ansatz für Parallellauf, in der Tat bin ich vorgeschlagen worden, die Sources und Targes Tabellen im ursprünglichen Datenbankschema zu kopieren, aber es sieht für mich nicht der beste Weg zu gehen (auch nicht praktisch wenn ein Schema hat viele Tabellen).

Die DWH Ich habe natürlich mehrere DBS-Instanz in Oracle und einige in SQL Server, einen Test-Server und eine Produktion, sowie für jeden, ein Staging, Storage und Data Mart Bereich.

Aus dieser verwandten Frage und ihre Antwort, ich denke, jedes Schema für jedes Projekt unterwegs zu kopieren.

Staging in ETL: Best Practices

Suche guidlines Referenzen haben, aber mein spezieller Fall ist die Migration vom IBM Data Manager auf Informatica Powercenter

+0

Diese Frage eignet sich nicht gut für das Q & A-Format von SO. Aber hier ist ein allgemeiner Ratschlag. Erstellen Sie eine Kopie der Zieldatenbank (en). Erstellen Sie ELT neu, indem Sie eine neue Software verwenden. Führen Sie alte und neue aus. Überprüfen Sie, ob sie genau die gleichen Ergebnisse liefern. Dann überprüfen Sie noch einmal und noch einmal. Läuft parallel so lange wie möglich. Dies erhöht die Wahrscheinlichkeit, dass obskure/seltene Fehler auftreten. Migrationen können sehr schnell sehr kompliziert werden. Also ändere nichts auf dem Weg. Upgrades, Korrekturen und neue Ideen können warten. Stellen Sie sicher, dass Sie zu der alten Lösung zurückkehren können, wenn am Migrationstag alles schief geht. Test zurückrollen. –

+0

@ Ziel-Daten Ich verstehe SO Q & A-Format, aber ich sehe nicht, wie meine Frage ist nicht eine gute Passform, da ich so genau wie ich konnte (ich bearbeite es Schreiben der ETL-Software beteiligt). Ich frage nicht nach Meinungen, sondern nach einer Liste von Best Practices/Erfahrungen für solch komplexe Aufgaben (Migration von einer ETL zu einer anderen, nicht so häufig). Ihr Vorschlag ist alles vernünftig und das war meine erste Annäherung, natürlich kann nicht eine Lösung in einer Antwort geschrieben werden, aber sicher, wenn es einen Senior ETL Ingenieur da draußen gibt, könnte er/sie mir eine Straßenkarte geben (aber spezifischer von was ich schon im Sinn habe) –

+0

Wenn meine Frage nicht gut für SO Q & A passt, dann sollte das gleiche für diese eine ich verlinkt und viele ähnliche sein. Auf der anderen Seite, was ist Ihr Vorschlag, um meine Frage fit für die Q & A zu machen? Danke –

Antwort

1

Der Ansatz hängt von verschiedenen Kriterien und persönlichen Vorlieben. In beiden Fällen müssen Sie Teile oder alle Quell- und Zielsysteme duplizieren. In einem Extremfall können Sie zwei Instanzen des gesamten Systems verwenden. Wenn Sie über komplexe Upstream-Prozesse verfügen, die Teil des Tests sind, oder wenn Sie über eine große Anzahl von Tabellen und Prozessen verfügen und über die erforderliche Bandbreite und Ressourcen verfügen, um Ihr System zu duplizieren, ist dieser Ansatz möglicherweise optimal. Im anderen Extremfall, wenn komplexe Prozesse innerhalb des ETL-Tools selbst auftreten oder Sie einfach nur Tabellen laden und überprüfen müssen, ob sie korrekt geladen sind, dann kopieren Sie die Tabellen und zeigen Sie Ihr neues oder altes Tool an Tischkopien können der richtige Weg sein. Diese Methode ist sehr einfach und einfach einzurichten.

Denken Sie daran, dass dieses Forum nicht Blogs und ausführliche Tech-Artikel zu diesen Techniken ersetzen soll.

+0

Ich gehe mit dem zweiten Ansatz, so dass die eine weniger komplizieren, weil bis jetzt für mein Wissen, Projekte komplizierter ETL-Prozess nicht involvieren (und das gleiche könnte anders mit dem neuen, Informatica angegangen werden), sogar ich vereinfacht wie ich kann es schaffen, aus der Quelle nicht in der gleichen Zeit die Aufträge im alten System zu extrahieren, so kann man die gleiche Quelle verwenden). Ich gehe mit diesem Ansatz, zumindest soweit ich keine andere Anfrage habe. –