ich unten Code verwenden Wort zu konvertieren Datei in HTMLApache poi Wort Konvertierung in HTML - Worten Boundry
public Map convert(String wordDocPath, String htmlPath,
Map conversionParams)
{
log.info("Converting word file "+wordDocPath)
try
{
String workingFolder = "C:\temp"
File workingFolderFile = new File(workingFolder)
FileInputStream fis = new FileInputStream(wordDocPath);
XWPFDocument document = new XWPFDocument(fis);
XHTMLOptions options = XHTMLOptions.create().URIResolver(new FileURIResolver(workingFolderFile));
options.setExtractor(new FileImageExtractor(workingFolderFile))
File htmlFile = new File(htmlPath);
OutputStream out = new FileOutputStream(htmlFile)
XHTMLConverter.getInstance().convert(document, out, options);
log.info("Converted to HTML file "+htmlPath)
}
catch(Exception e)
{
log.error("Exception :"+e.getMessage(),e)
}
}
Der Code richtig HTML-Ausgabe generiert.
Ich muss einige Parameter in das Dokument wie [[AGENT_NAME]]
, dass ich später im Code mit Regex ersetzen werde. Aber apache poi behandelt dieses Muster nicht als einzelnes Wort und spaltet manchmal "[[", "AGENT_NAME" & "]]" und fügt einige Tags mit Stilen dazwischen ein. Ich kann Regex nicht schreiben und die Parameter deshalb ersetzen.
Wie entscheidet Apache Poi über Wortgrenzen? Gibt es eine Möglichkeit, es zu kontrollieren?
Apache POI entscheidet nicht über Grenzen Wort, es wird seine Wahl Microsoft Word bei der Generierung die Originaldatei ... – Gagravarr
Kann mehr dazu erklären? Jeder Link wird hilfreich sein. Gibt es einen speziellen Charakter, der Teil der Wortgrenzen ist? – Fayaz
Den Code debuggen (XWPFDocument.paragraphen) und OpenOffice-Spezifikationen durchgehen http://officeopenxml.com/WPparagrapha.php, ich habe verstanden, dass MsWord Text in Läufe irgendwo im Dokument teilen kann. Es kann sogar einen einfachen fortlaufenden Text aufteilen, der keine Sonderzeichen (wie AGENTNAME) enthält. Aber können wir dieses Verhalten kontrollieren? Wie kann man einen Text als einen einzigen Lauf betrachten? – Fayaz