2017-02-09 4 views

Ich versuche Textdatei mit Emoji-Inhalt in die Datei mit Emojis HTML-Code oder Hex-Code mit Java zu konvertieren. Beispiel:Konvertieren von Emoji in HTML Dezimalcode oder Unicode-Hexadezimalcode in Java

I/p: <div id="thread" style="white-space: pre-wrap;"><div>⚽️

Erwartete o/p: <div id="thread" style="white-space: pre-wrap;"><div>😀😀😃🍎🍏⚽️🏀

In oben aus '' setzen sollte '& # 128512;'

Detail des HTML-Entity-Code zu dem entsprechenden HTML-Code der Einheit erhalten geändert und Hex-Code wird hier gegeben: http://character-code.com/emoticons-html-codes.php

Beispielcode, der Ich habe versucht, unten:

try { 
      File file = new File("/inFile.txt"); 
      str = FileUtils.readFileToString(file, "ISO-8859-1"); 
      System.out.println(new String(str.getBytes(), "UTF-8")); 
      String results = StringEscapeUtils.escapeHtml4(str); 
     } catch (IOException e) { 

Also Sie Code haben, etwas zu tun, Sie zeigen uns, nicht den Code, und dann fragen, warum der Code nicht funktioniert? * Wirklich?!?!? * – Andreas


hinzugefügt Beispielcode, den ich ausprobiert habe. –


Sind Sie sicher, dass die Datei die ISO-8859-1-Kodierung verwendet? Das scheint ... unwahrscheinlich. – dnault


I got the work around : 
public static void htmlDecimalCodeGenerator() { 

    DocumentBuilderFactory domFactory = DocumentBuilderFactory.newInstance(); 


    // File inputFile = new File("/inputFile.xml"); 
    File inputFile = new File("/inputFile.xml"); 

    try { 

    FileOutputStream fop = null; 

    File OutFile = new File("/outputFile.xml"); 

    fop = new FileOutputStream(OutFile); 

    DocumentBuilder builder = domFactory.newDocumentBuilder(); 

    Document doc = builder.parse(inputFile); 

    TransformerFactory tf = TransformerFactory.newInstance(); 

    Transformer transformer = tf.newTransformer(); 

    no value of OMIT_XML_DECLARATION will add following xml declaration in the beginning of the file. 
    <?xml version='1.0' encoding='UTF-32'?> 
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes"); 


    When the output method is "xml", the version value specifies the 
    version of XML to be used for outputting the result tree. The default 
    value for the xml output method is 1.0. When the output method is 
    "html", the version value indicates the version of the HTML. 
    The default value for the xml output method is 4.0, which specifies 
    that the result should be output as HTML conforming to the HTML 4.0 
    Recommendation [HTML]. If the output method is "text", the version 
    property is ignored 
    transformer.setOutputProperty(OutputKeys.METHOD, "xml"); 

    Indent-- specifies whether the Transformer may 
    add additional whitespace when outputting the result tree; the value 
    must be yes or no. 
    transformer.setOutputProperty(OutputKeys.INDENT, "no"); 

    transformer.setOutputProperty(OutputKeys.ENCODING, "ISO-8859-1"); 

    // transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4"); 

    transformer.transform(new DOMSource(doc), 

    new StreamResult(new OutputStreamWriter(System.out, "UTF-8"))); 

    // new StreamResult(new OutputStreamWriter(fop, "UTF-8"))); 

    } catch (Exception e) { 



