2008-12-17 1 views
6

Mögliche Duplizieren:
Reading/Writing MS Word files in PythonGibt es eine Python-Bibliothek zum Bearbeiten von msword doc-Dateien?

Ich weiß, es gibt einige Bibliotheken für die Bearbeitung von Excel-Dateien, aber gibt es etwas für die Bearbeitung msword 97/2000/2003 .doc-Dateien in Python? Im Idealfall möchte ich die Formatierung des Textes anhand des Inhalts des Textes geringfügig ändern. Ein wirklich triviales Beispiel wäre die Hervorhebung jedes Wortes, das mit einem Kapital beginnt.

Antwort

4

Warum nicht mit Hilfe von python-uno das Dokument in OpenOffice laden und mit der UNO-Schnittstelle manipulieren. Auf der Seite, mit der ich gerade verlinkt bin, gibt es einen Beispielcode, mit dem Sie beginnen können.

+0

Es könnte gut sein zu sagen, wie man auf XScriptContext zugreifen kann, da es nicht mit Python ausgeliefert wird. – Shule

1

Mit der Bibliothek PyWin32 können Sie auf COM-Objekte von Python aus zugreifen, einschließlich aller verschiedenen Office COM-APIs. Ich werde nicht behaupten, es ist einfach zu verwenden, aber es funktioniert.

+0

Irgendeine Idee, wie man das in Linux macht? – Shule

+0

Neuere Office-Dateien könnten möglicherweise mit Mono bearbeitet werden, aber das habe ich noch nie probiert. –

3

Wenn Plattformunabhängigkeit wichtig ist, würde ich empfehlen, die OpenOffice API entweder über BASIC oder Python zu verwenden. OpenOffice kann auch im Headless-Modus ohne GUI ausgeführt werden, sodass Sie es für Batch-Jobs automatisieren können. Diese Links könnten hilfreich sein:

Es ist definitiv mehr beteiligt als ein Modul zu importieren und dabei eine Zeichenfolge ersetzen, aber Openoffice ist wahrscheinlich die besten kostenlosen .doc Leser, dass Sie kann einhaken.

1

Pro this SO post habe ich über jXLS herausgefunden, die Apache POI verwendet. POI hat viele Subkomponenten, einschließlich HWPF:

HWPF ist unser Port des Microsoft Word 97-Dateiformat auf reine Java. Es unterstützt lesen und begrenzte schreiben Fähigkeiten. Weitere Informationen finden Sie auf der HWPF Projektseite. Diese Komponente ist in den frühen Stadien der Entwicklung. Es kann bereits lesen und einfache Dateien schreiben.

Da dies eine Java-Bibliothek ist, könnte sie mit Jython geschrieben werden. Ich weiß nicht, wie gut die Schreibfähigkeiten sind, aber bitte poste einen Kommentar, wenn es hilft.

Verwandte Themen