Im Textfeld, wenn ich von Word kopieren, Junk-Zeichen eingefügt werden. Beim Veröffentlichen von Parametern von der jsp-Seite bleibt es in Ordnung. Aber während der Parameter in Java abgerufen wird, wird er in Junk umgewandelt. Ich habe den folgenden Code verwendet, um Müll vor dem Einfügen zu beseitigen. Ich benutze MySQL-Datenbank. (JBOSS 5.1 GA-Server)Junk-Zeichen entfernen in Java
String outputEncoding = "UTF-8";
Charset charsetOutput = Charset.forName(outputEncoding);
CharsetEncoder encoder = charsetOutput.newEncoder();
byte[] bufferToConvert = userText.getBytes();
CharsetDecoder decoder = (CharsetDecoder) charsetOutput.newDecoder();
try {
CharBuffer cbuf = decoder.decode(ByteBuffer.wrap(bufferToConvert));
ByteBuffer bbuf = encoder.encode(CharBuffer.wrap(cbuf));
userText = decoder.decode(bbuf).toString();
} catch (CharacterCodingException e) {
e.printStackTrace();
}
aber ich bin immer noch immer Junk-Zeichen für Apostroph ('') und doppelte Anführungszeichen (""). Ich brauche die Zeichenfolge in UTF-8. Kann jemand vorschlagen, wo ich falsch liegen kann?
Beispiel: Eingabe - "esgh". Ausgabe - â ?? esghâ ??: Gesucht Ausgang - "esgh".
Können Sie ein paar Beispiele für Eingabe und gewünschte Ausgabe geben? – Keppil
Ich habe ein Beispiel gegeben. aber es passiert auch für einfaches Zitat. –
Konnten Sie nicht einfach nach ASCII-Werten filtern? Nehmen Sie einfach alles größer als 31 und kleiner als 128. –