2009-07-30 6 views

Antwort

2

Ich kann nur spezifisch mit SSIS sprechen, obwohl einige davon auch für die anderen anwendbar sind.

Speichern Sie Ihre Pakete als Dateien und fügen Sie sie in die Quellcodeverwaltung ein.

Wo möglich Variablen für Dinge verwenden, die von Server zu Server wechseln oder zur Ausführung laufen.

Verwenden Sie Konfigurationsdateien, um die Konfiguration für verschiedene Umgebungen zu speichern.

Gehen Sie bei der Verarbeitung von Daten, die von einer externen Quelle stammen, davon aus, dass das Format ohne Warnung geändert wird (dh, dass die Daten in den einzelnen Spalten die Daten enthalten!) (oder wie es uns einmal in DTS passiert ist, die Sozialversicherungsnummer in das Feld, die sagte, wie viel die Person zu zahlen, sicher froh, dass wir das erwischt haben, bevor jemand diesen Betrag bezahlt hat.).

Dinge, die ich gesehen habe, schließen das Hinzufügen neuer Spalten ein, entfernen Spalten, die für Ihren Prozess kritisch sind, ordnen die Reihenfolge der Spalten (besonders schlecht, wenn die Datei selbst keine Spaltennamen hat), wobei die Spaltentitel gleich bleiben aber das Ändern der Daten, die sie enthalten (ja, wenn ich einmal eine Datei gefunden habe, in der die Daten des letzten Namens in der Spalte Vorname und umgekehrt standen), Daten mit neuen Werten, die keine Übereinstimmung mit Werten in Ihrem System haben (ich denke Nachschlagen schreiben Dinge hier wie medizinische Spezialitäten), flat out seltsame Daten wie Notizen in einem E-Mail-Feld, Namen in diesem Format Nachname - 'Willams, Jo' first_name - 'hn' (kombinieren Sie die beiden Felder, um den ganzen Namen zu bekommen - Offensichtlich haben ihre Dateneingabe-Leute nur den Namen eingegeben, bis sie keine Leerzeichen mehr hatten und im nächsten Feld weitermachten, egal wo sie im Namen waren!).

Geben Sie keine ungereinigten Daten in Ihre Datenbank ein.

Behalten Sie immer eine Kopie aller Dateien, die Sie verarbeiten oder senden. Unglaublich, wie oft Sie nachforschen müssen.

Protokollfehler und Protokolldatensätze, die bereinigt werden mussten, insbesondere, wenn das Problem vor Ort so war, dass der Prozess fehlgeschlagen ist. Es ist viel einfacher, die Fehler in einer Tabelle zu sehen, als zu wissen, dass Ihre 20-Millionen-Datensatzdatei fehlgeschlagen ist, weil ein Datensatz ein zusätzliches | hat darin und versuchen herauszufinden, welcher es war.

Wenn Sie viele ähnliche Importe in SSIS durchführen, erstellen Sie ein Vorlagenprojekt, das über die Standardprotokollierung und Datenbereinigung verfügt. Es ist viel schneller, von einer Vorlage zu starten und sich an neue Zuordnungen anzupassen, die auf der neuen Datei basieren, mit der Sie gerade arbeiten, und geringfügige Anpassungen an bestimmten Dateien vorzunehmen, anstatt jedes SSIS-Paket von Grund auf neu zu schreiben.

Metadaten speichern. Früher oder später werden Sie gefragt, wie oft es gescheitert ist oder wie schnell nach dem Erhalt der Datei der Import erfolgte oder wann der letzte Import erfolgte. Alle unsere Pakete beginnen und enden mit einer Aufgabe zum Speichern von Start- und Stoppzeiten in unserer Metadatentabelle. Alle Fehlerpfade enthalten eine Aufgabe, um den Import in unseren Metadaten als fehlgeschlagen zu markieren. Schließlich können Sie ein System erstellen, das weiß, wie viele Datensätze zu erwarten sind, und es fehlschlagen, wenn die neue Datei deutlich ausgeschaltet ist. Meta-Daten können auch verwendet werden, um Dinge wie die Anzahl von Datensätzen zu speichern, die Ihnen helfen, zu erkennen, wann sie eine Teildatei anstelle der gesamten Datei gesendet haben und 300.000 Verkaufsziele wegblasen, die sie eigentlich noch wollen.

Verwandte Themen