Wenn Sie MS Office haben und Sie die PPT im RTF (Rich Text Format) speichern, enthält es nur den Text aus der Präsentation. Sie könnten die Datei dann in einem beliebigen Editor öffnen, der RTF-Dateien versteht und als Textdatei (TXT) speichern.
Ich erwarte, dass dies auch von Open Office funktioniert.
Da Sie von API sprechen, ist dies möglicherweise nicht der Weg für Sie, aber vielleicht gibt es Ihnen neue Ideen auf dem Weg dorthin. Sprich: Sie mehrere Makros verwenden, um die Umwandlung in Stufen zu tun ...
Edit: Ich wurde neugierig und haben eine kurze Google-Suche
das, was ich auf one of the www.openoffice.org pages gefunden ist
Da die Menschen in Dieser Thread hat darauf hingewiesen, das Abrufen von Text aus einem OO Dokument ist nicht schwer, da es nur gezippte XML ist, die mit einem Perl-Skript geparst werden kann. Das Problem besteht darin, Microsoft Powerpoint-Dokumente zuerst in ein gezipptes XML-Format in ein zu bekommen.
Ich habe festgestellt, dass Datei -> Assistenten -> Document Converter genau das tut. Sagen Sie einfach, dass Sie PowerPoint-Dokumente konvertieren möchten, nicht Vorlagen, zeigen Sie es auf Ihr Quellverzeichnis und wo Sie möchten, dass es das Ergebnis ausspuckt und Sie sind weg.
Ich finde dann unzip -p $ file.sxi content.xml | perl -p -e "s/< [^>] >/\ n/g; s/+ //; s/\ n \ n/\ n/g;" -w
funktioniert eher gut zum Extrahieren des Textes.
Entschuldigung, ich habe kein Open Office, um das auszuprobieren.
speichern, da RTF nicht funktioniert. Es scheint nur einen Index der Folien in der Datei zu speichern – ekkis