Nicht über die API, noch nicht mindestens. Sie müssten die XML-Struktur, in der sie sich befinden, aufdecken und auf die Ebene lxml und vielleicht XPath gehen, um sie zu finden. So etwas wie dies könnte ein Anfang sein:
body = doc._body
# assuming differentiating container element is w:textBox
text_box_p_elements = body.xpath('.//w:textBox//w:p')
Ich habe keine Ahnung, ob textBox ist der eigentliche Element Name hier, würden Sie, dass aus mit dem Rest der XPath-Pfad Details sortieren müssen, aber dieser Ansatz wird wahrscheinlich Arbeit. Ich verwende häufig ähnliche Ansätze, um Features zu umgehen, die noch nicht in die API integriert sind.
opc-diag
ist ein nützliches Werkzeug zur Überprüfung der XML. Der grundlegende Ansatz besteht darin, eine minimal kleine .docx-Datei zu erstellen, die den Typ der Sache enthält, die Sie suchen möchten. Dann opc-Diag verwenden, um die XML-Wort erzeugt zu inspizieren, wenn Sie die Datei speichern:
$ opc browse test.docx document.xml
http://opc-diag.readthedocs.org/en/latest/index.html
In Word-Dateien leben TextBoxen in einem separaten Objekt. Vom flüchtigen googlen hat 'python-docx' Zugriff auf InlineShapes, aber nicht auf TextBoxes. – usr2564301