2012-04-05 18 views
0

Ich möchte auf Office 2003-Dateien (.doc, .xls und .ppt) zugreifen, um Text und einige Metadaten (Anzahl der Wörter, Anzahl der Blätter, Bilder, Vorlage usw.) zu extrahieren. . Ich kann es mit Open XML SDK für Office 2007-Dokumente tun. Dieses Extrahieren findet jedoch auf einem Server statt, auf dem keine Apps wie Microsoft Office installiert sein können (aus diesem Grund kann ich Office's Interop nicht verwenden). Ich habe versucht, NPOI, aber tatsächlich unterstützt nur .xls-Dateien. Die anderen Bibliotheken, die ich gefunden habe, sind nicht Open Source, ich kann sie nicht für meine Arbeit verwenden ... Ich habe NPOI Scratchpad heruntergeladen, aber der Code ist sehr "roh", ich kann ihn nicht für meine Arbeit verwenden. Haben Sie eine andere Idee, um den Text und die Metadaten von Office 2003-Dokumenten zu erhalten? Ich bin kein sehr erfahrener Programmierer, und ich benutze C# (Wenn es jedoch eine Lösung für dieses Problem in C++ gibt, könnte ich darüber nachdenken, es zu verwenden). Vielen Dank.Zugriff auf Office 2003-Dateien

Antwort

1

Es gibt viele Bibliotheken wie:

  • ClosedXML (Office 2007)
  • EPPlus (Office 2007)
  • Aspose Zellen (Office 97-2010, ich diese benutzen)

Ich kenne keine freien Bibliotheken, die das Office 2003-Format unterstützen.

Glück

Verwandte Themen