Mögliche Duplizieren:
Python UnicodeDecodeError - Am I misunderstanding encode?Python: Sanitize eine Zeichenfolge für Unicode?
Ich habe eine Zeichenfolge, die ich versuche, sicher für die unicode()
Funktion zu machen:
>>> s = " foo “bar bar ” weasel"
>>> s.encode('utf-8', 'ignore')
Traceback (most recent call last):
File "<pyshell#8>", line 1, in <module>
s.encode('utf-8', 'ignore')
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 5: ordinal not in range(128)
>>> unicode(s)
Traceback (most recent call last):
File "<pyshell#9>", line 1, in <module>
unicode(s)
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 5: ordinal not in range(128)
ich meistens bin flailing um Hier. Was muss ich tun, um die unsicheren Zeichen aus der Zeichenfolge zu entfernen?
Etwas zu diesen question Zusammenhang, auch wenn ich nicht in der Lage war mein Problem von ihm zu lösen.
Dies scheitert auch:
>>> s
' foo \x93bar bar \x94 weasel'
>>> s.decode('utf-8')
Traceback (most recent call last):
File "<pyshell#13>", line 1, in <module>
s.decode('utf-8')
File "C:\Python25\254\lib\encodings\utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x93 in position 5: unexpected code byte
Ich frage mich, warum 'str' überhaupt eine' encode'-Funktion hat und ob der Parameter "encoding" die Kodierung des Ergebnisses oder die Kodierung des Eingangs angibt. Was genau versuchst du hier zu machen? – Thanatos
Bitte überprüfen Sie [this] (http://stackoverflow.com/questions/368805/python-unicodedecodeerror-am-i-misunderstanding-encode/370199#370199) Antwort auf eine verwandte Frage: "Python UnicodeDecodeError - bin ich Missverständnis Encode? " – tzot
Für diejenigen, die nach einer Lösung suchen, um Unicode-Sonderzeichen in (X) HTML zu bereinigen, versuchen Sie' u'my unicode str'.encode ('ascii', 'xmlcharrefreplace') '. – toszter