2015-09-28 13 views
6

I-Code haben, etwas, wie diesePrevent JSOUP von unencoding Attributwerte

String str = "<element data=\"some &lt;data&gt;\"> &gt;foo&lt; </element>"; 

Document doc = Jsoup.parse(str, "", Parser.xmlParser()); 

Aber JSOUP unencodes Wert Daten, so etwas wie dieses

<element value="some <data>"> 
    &gt;foo&lt; 
</element> 

Herstellung Wie kann ich JSOUP von unencoding verhindern Attributwerte?

+0

Was ist Ihre erwartete Ausgabe? Dies ist meine ' ‚> ' –

+0

Ich würde erwarten, dass es ' sein' – centerback

+0

Es gibt offenbar keine Möglichkeit, das zu tun: [hier ] (http://jsoup.org/apidocs/org/jsoup/Jsoup.html#parse-java.lang.String-java.lang.String-) Warum änderst du es nicht selbst mit einer Regex? –

Antwort

1

Sie treffen ein bekanntes Problem von Jsoup (1.8.3 zum Zeitpunkt des Schreibens).

Sehen Sie hier für weitere Details: https://github.com/jhy/jsoup/issues/55

Die Ausgabe am 27. Dezember 2010 bekannt gegeben worden ist ... fast 5 Jahre vor Ihrer Frage. Ich hoffe, dass die Upvotes darauf aufmerksam machen werden.

UPDATE
Jsoup Autor hat das Thema geschlossen als NOT beheben.