2017-03-21 1 views
2

Ich habe ein Projekt über die Umwandlung von Word DOCX XML (OOXML) -Dateien in HTML-Format.Wie konvertieren wir eine Microsoft Word-DOCX-Datei in XSLT in HTML?

Ich verwende XML Spy und XSLT, XPath, XML für diese Transformation.

Stellen Sie sich eine einzelne Word-Datei vor, die ich ein Programm in XSLT schreibe und es umwandle. Aber mein Vorgesetzter sagt, dass, wenn ich einen Wert in der Datei ändere, dieser Ansatz nicht funktioniert.

Ich stimme dem zu, weil ich den Code nur für dieses Dokument angeben, weil ich weiß, was darin enthält.

Aber wie schreiben wir einen allgemeinen Code in XSLT, um alle Word-Dateien als wohlgeformtes HTML-Dokument zu transformieren (da ein Word-Dokument sehr unterschiedlich sein kann)?

Das Problem ist, dass ich versuche, es mit XSLT zu tun? Ist hier etwas nicht in Ordnung? Oder bin ich gerade so chaotisch?

Antwort

2

Ihr Plan, XSLT zu verwenden, um DOCX-Dateien in HTML umzuwandeln, ist grundsätzlich solide. XSLT ist für diesen Zweck ideal, da es für die Zuordnung von XML zu XML (oder (X) HTML) gut geeignet ist.

Ihre Herausforderung wird sein, dass das XML, das DOCX zugrunde liegt, komplex ist. Ecma Office Open XML Part 1 - Fundamentals And Markup Language Reference allein ist über 5K Seiten lang. Wenn Sie XML, XML-Namespaces, XSLT, HTML und CSS gut kennen, müssen Sie "nur" einige Grundlagen von OOXML lernen, um zu beginnen.

Die Sorge über die Änderung eines Wertes ist egal, wenn Sie dies robust und grundlegend OOXML verstehen. Beginnen Sie mit dem Begriff der Textausführungen in den Absätzen: w:t, w:r und w:p.

Eric White hat ausführlich über OOXML im Allgemeinen geschrieben und sogar speziell in HTML umgewandelt. Siehe Transforming Open XML WordprocessingML to XHtml für ausgezeichnete Artikel und Beispiele.

+0

Vielen Dank, dass ich endlich herausgefunden habe, wie man es in XSLT transformieren kann. Der Hauptgrund ist, dass ich diese Syntax w: t, w: r usw. nicht kannte und wie man sie in XPath adressiert. Das war hilfreich gracias :) aber jetzt habe ich ein anderes Problem und es ist Transformation der Listen in Wort. Ich weiß nicht, ob ich das Problem hier ebenso gut schreiben kann oder sollte ich ein anderes Thema öffnen :) – Sojimanatsu

+0

Eine andere Frage für ein anderes Thema würde definitiv passend sein. – kjhughes

Verwandte Themen