Ich habe die Apache HWPF heruntergeladen. Ich möchte es verwenden, um eine doc-Datei zu lesen und den Text in eine einfache Textdatei zu schreiben. Ich kenne die HWPF nicht so gut.Wie Apache HWPF verwenden, um Text und Bilder aus einer DOC-Datei zu extrahieren
Meine sehr einfaches Programm ist hier:
ich jetzt 3 Probleme:
Einige Pakete Fehler haben (sie können nicht Apache hdf finden). Wie kann ich sie reparieren?
Wie kann ich die Methoden von HWDF verwenden, um die Bilder zu finden und zu extrahieren?
Ein Teil meines Programms ist unvollständig und falsch. Also bitte hilf mir, es zu vervollständigen.
Ich muss dieses Programm in 2 Tagen abschließen.
noch einmal ich wiederhole bitte Bitte helfen Sie mir, dies zu vervollständigen.
Danke euch Jungs viel für eure Hilfe !!!
Das ist mein Grundcode:
public class test {
public void m1(){
String filesname = "Hello.doc";
POIFSFileSystem fs = null;
fs = new POIFSFileSystem(new FileInputStream(filesname);
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
String str = we.getText() ;
String[] paragraphs = we.getParagraphText();
Picture pic = new Picture(. . .) ;
pic.writeImageContent(. . .) ;
PicturesTable picTable = new PicturesTable(. . .) ;
if (picTable.hasPicture(. . .)){
picTable.extractPicture(..., ...);
picTable.getAllPictures() ;
}
}
Verwandte: http://stackoverflow.com/questions/1870328/how-to-programmaticaly-extract-and-manipulate-images-from-an-office-file – Thilo