2009-04-08 6 views
0

Wir müssen die Datenbankaktualisierung mehrmals im Monat automatisieren.Aktualisieren der Back-End-Datenbank aus gekochter XML/PDF-Eingabe: Welches ist das beste Tool/Ansatz?

Mein aktueller Anwendungsfall ist wie folgt.

Momentan werden die Eingabedaten manuell mit dem Eingang des vorherigen Monats verglichen. Wenn es XML ist, verwenden wir MS xmldiff. Wenn es PDF ist, ist es vollständig durch manuelle Überprüfung :-(.

Sobald die Änderungen gefunden werden, aktualisieren wir die Datenbank über eine Formularschnittstelle (wieder manuell). Die Änderungen könnten neue Einträge erstellen, die Aktualisierung vorhanden Einträge oder Entfernen ältere Einträge. da dieser Gesamtprozess sowohl Zeit und manuellen raubend nicht extrem langweilig und frustrierend für eine einzelne Person zu nennen, sind wir Suche nach Möglichkeiten, diesen Prozess so weit wie möglich zu automatisieren.

wir sind Derzeit denken wir daran, das Ganze mit einer Skriptsprache (speziell Python) zu implementieren, aber wir haben derzeit niemanden, derhatErfahrung in Skriptsprachen, so dass wir im Grunde lernen müssen, wie wir gehen.

Die Fragen, die wir beantworten, möchten, bevor wir in sind springen

1) mit einer Skriptsprache der richtige Ansatz wird? Wir denken, dass die Skriptsprache besser ist, da mehrere Bereiche abgedeckt werden müssen (XML diff, Datenbankkonnektivität, Erstellen von XML usw.). Gibt es noch andere Alternativen oder Werkzeuge?

2) Ist Python so gut wie jede andere Sprache? Basierend auf dem, was wir gegoogelt, Python scheint reif zu sein und unterstützt alle Arten von Datenbank Konnektivität durch Bibliotheken. Gibt es noch andere Alternativen, die wir untersuchen sollten?

3) Gibt es irgendwelche guten und kostenlosen Diff-Tools, die auf PDF-Dateien funktionieren? Wir suchen nach etwas, das überprüfen kann, ob eine bestimmte Tabelle oder Überschrift Inhalt in einer PDF geändert wird und die Ausgabe dump.

Nur zur Info die Datenbank ist MS-Zugriff.

Danke für Ihre Zeit.

Antwort

1

Ich denke, Python ist einfach Sprache zu lernen, und meiner Meinung nach, wenn Sie VBScript-Erfahrung haben, sollten Sie in der Lage sein, es schnell aufzunehmen.

Ich habe BeautifulSoup für mein XML/HTML-Parsing verwendet, was ich sehr einfach fand. http://www.crummy.com/software/BeautifulSoup/documentation.html

Für PDF Sachen können Sie einen Blick auf rportlab Toolkit nehmen (was ich nicht verwendet haben) http://www.reportlab.org/

+0

Dank. Wir werden die Links ausprobieren. Also ist der skriptbasierte Ansatz das Beste für diese Art von Szenario? – user88595

Verwandte Themen