Vielleicht können Sie so etwas wie verwenden:
yourTxt = yourTxt.replaceAll("&", "&");
in einem Projekt ich etwas tat, wie:
public String replaceAcutesHTML(String str) {
str = str.replaceAll("á","á");
str = str.replaceAll("é","é");
str = str.replaceAll("í","í");
str = str.replaceAll("ó","ó");
str = str.replaceAll("ú","ú");
str = str.replaceAll("Á","Á");
str = str.replaceAll("É","É");
str = str.replaceAll("Í","Í");
str = str.replaceAll("Ó","Ó");
str = str.replaceAll("Ú","Ú");
str = str.replaceAll("ñ","ñ");
str = str.replaceAll("Ñ","Ñ");
return str;
}
Ich bin interessiert, warum sind Sie die HTML immer codierten strings ... In meiner "idealen" App sollte der Programmierer niemals ... (einfach das Ergebnis html codieren, aber es empfangen ... nie) – helios
Es ist Legacy-Code, der Daten speichert, es ist ein solches Rohformat, das ich lesen muss und wandle es um. – Vladimir
Oh. Im Falle von seltsamen Zeichen ... sieht es so aus, als wäre es ursprünglich ein UTF-8-Zeichen und wurde als ISO-8859-1 (Western ISO) decodiert (gelesen) ... als Beispiel. Wenn Sie ein Ñ haben, hat es 2 Bytes in UTF-8, also, wenn Sie es in iso-western lesen, liest es zu fremden Zeichen. Wenn das der Fall ist und Sie wissen, dass die Codierungen, die Sie codieren, 'new String (byte [], encodingName)' und 'someString.getBytes (encodingName)' verwenden, um die guten Zeichen zu erhalten. – helios