2010-09-03 21 views
9

Ich habe eine .docx-Datei und sie enthält viele E-Mail-Adressen, an die ich Massenmails senden möchte. Wie kann ich docx Datei durch C# lesen?Wie kann ich .docx Datei lesen?

Antwort

12

Der einfachste Weg ist wahrscheinlich der Open XML SDK 2.0

Code Snippets for Visual Studio 2008 Erhalten Sie für einige Beispiele verwenden

Und ich würde das Open XML-Download empfehlen SDK Productivity Tool, das Ihnen hilft zu verstehen, wie die Open XML-Dateien strukturiert sind, und kann Ihnen sogar dabei helfen, Quellcode für die Verwendung mit dem SDK basierend auf der Struktur Ihrer Dokumente zu generieren. Sie können das Tool von derselben Seite wie das SDK herunterladen. Es ist 100 MB, aber es ist den Download wert.

+0

installierte ich das SDK, das von 3 MB ist. Aber kannst du mir sagen, wo ich Beispiele dafür finde? Wie benutze ich es? – TCM

+0

Ich aktualisierte meine Antwort mit einigen zusätzlichen Informationen. – Gerald

3

docx-Dateien sind in der Tat Archive zu öffnen und zu lesen.

Sie können sie in ihre zusammengesetzten XML-Dateien entpacken und die entsprechende XML-Datei (file.docx \ word \ document.xml) durchlesen und die E-Mail-Adressen herausziehen.

Diese Bibliothek Sie das Archiv entpacken helfen: .Net Zip Library

5

Ja, ich weiß, dass dies ein sehr alter Beitrag ist, aber diese Information könnte anderen helfen, die das Forum durchsuchen.

Verwenden Sie this Bibliothek von Sourceforge. einen Verweis In dieser Bibliothek, und dann:

Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);

string contents = extractor.ExtractText();

8

Sie einfach Docx Bibliothek verwenden können, ist es sehr gut und einfach zu bedienen.

Für Beispiele zur Verwendung und viele Beispiele und Videos, überprüfen Sie ihre GitHub Seite. Zum herunterladen, könnten Sie download from here

+0

DocX scheint das beliebteste Paket auf Nuget zu sein. –

+0

die beste !!!!!!! – elle0087

2

Es gibt kostenlose Möglichkeit, doc & docx-Datei zu lesen, könnte es Ihnen helfen.

Document doc = new Document(); 
doc.LoadFromFile("yourfile.docx"); 

http://freeword.codeplex.com/

+0

Die Version "free" (closed source) hat mehrere Einschränkungen. Auf Codeplex gibt es nur einige Beispiele für die Verwendung dieser geschlossenen Quellbibliothek. – bubi