2016-03-29 3 views
-1

Ich habe eine Datei formatierung.doc. Es hat etwas Text drin. Jetzt habe ich dem Text im Dokument ein Format hinzugefügt. Ich habe vor dem Anfang des ersten Absatzes Platz hinzugefügt, einige Wörter unterstrichen, einige Wörter in Fettdruck gesetzt und den Absatz zentral begründet.Wie lese ich Daten aus einer Datei (Word-Dokument, Excel) mit Format in Java?

In meiner Anwendung habe ich versucht, die Datei mit Apache POI zu lesen und dann im PDF-Format mit iText anzuzeigen. Der von Apache POI zurückgegebene Text ist jedoch Rohdaten. d.h. ohne irgendeine Formatierung.

Gibt es in Java eine Möglichkeit, den Text einer Datei mit all ihrer Formatierung zu lesen?

+0

Bitte Code anzeigen. Es ist schwer zu sagen, was mit keinem Code falsch ist. – kichik

Antwort

0

Ich glaube, Ihre beste Option ist Apache Tika. Es verwendet Apache POI und einige andere Bibliotheken und bietet formatierte Extraktion unter anderem.

Verwandte Themen