Lesen binären Word-Dokumente in Abbildung würde einen Parser zu schaffen für die gemäß den veröffentlichten Dateiformatspezifikationen DOC-Format Ich denke, das ist keine wirklich machbare Lösung.
Sie könnten die Microsoft Office XML formats zum Lesen und Schreiben von Word-Dateien verwenden - das ist kompatibel mit den 2003 und 2007 Word-Version. Zum Lesen müssen Sie sicherstellen, dass die Word-Dokumente im richtigen Format gespeichert sind (Word 2003 XML-Dokument in Word 2007). Zum Schreiben müssen Sie nur dem frei verfügbaren XML-Schema folgen. Ich habe dieses Format noch nie zum Schreiben von Office-Dokumenten aus PHP verwendet, aber ich benutze es zum Einlesen in ein Excel-Arbeitsblatt (natürlich als XML-Spreadsheet 2003 gespeichert) und zum Anzeigen seiner Daten auf einer Webseite. Da es sich bei den Dateien einfach um XML-Daten handelt, ist es kein Problem, sich darin zu bewegen und herauszufinden, wie Sie die benötigten Daten extrahieren können.
Die andere Option - eine Word 2007 nur -Option (wenn die OpenXML-Dateiformate nicht in Word 2003 installiert sind) - wäre, zu OpenXML zu referenzieren. Als databyss hingewiesen here das DOCX-Dateiformat ist nur ein ZIP-Archiv mit XML-Dateien enthalten. Es gibt eine Menge von Ressourcen auf MSDN in Bezug auf das OpenXML-Dateiformat, so sollten Sie in der Lage sein, herauszufinden, wie Sie die gewünschten Daten lesen. Schreiben wird viel komplizierter, denke ich - es hängt nur davon ab, wie viel Zeit Sie investieren werden.
Vielleicht können Sie einen Blick auf PHPExcel werfen, die eine Bibliothek ist, die in Excel 2007-Dateien schreiben und aus Excel 2007-Dateien mit dem OpenXML-Standard lesen kann. Sie können sich ein Bild von der Arbeit machen, wenn Sie versuchen, OpenXML Word-Dokumente zu lesen und zu schreiben.
Ich finde es sehr unwahrscheinlich, dass Sie dies ohne COM erreichen könnten. –