Ich möchte den Inhalt einer .docx
Datei, Kapitelvise extrahieren. Also, mein .docx
Dokument hat ein Register und jedes Kapitel hat einige Inhalte.docx Datei Kapitel Extraktion
1. Intro
some text about Intro, these things, those things
2. Special information
these information are really special
2.1 General information about the environment
environment should be also important
2.2 Further information
and so on and so on
So schließlich wäre es toll, eine Nx3
Matrix zu erhalten, die Indexnummer, die Indexnamen und mindestens den Inhalt.
i_number i_name content
1 Intro some text about Intro, these things, those things
2 Special Information these information are really special
...
Danke für Ihre Hilfe
Eine R- oder Python-Lösung würde zu Ihnen passen? –
Eher in R wäre aber auch Python möglich. –