ich eine Zeichenfolge von Web-Crawl-Skript extrahiert haben, wie folgend:Python, wie Unicode mit Hex-Zeichen dekodieren
u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
I u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
mit utf-8 entschlüsseln wollen. Mit http://ddecode.com/hexdecoder/, kann ich das Ergebnis sehen '【中字】'
Ich habe versucht, mit der folgenden Syntax, aber gescheitert.
msg = u'\xe3\x80\x90\xe4\xb8\xad\xe5\xad\x97\xe3\x80\x91'
result = msg.decode('utf8')
Fehler:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-11: ordi
nal not in range(128)
Darf ich fragen, wie die Zeichenfolge richtig zu entschlüsseln?
Danke für Hilfe.
Die Zeichenfolge, die Sie empfangen, ist doppelt codiert. Es funktioniert gut ohne das "u" vor der Zeichenfolge. Sie sollten das Crawl-Skript überprüfen! –