ich eine Zeichenfolge haben sagen s = 'Chocolate Moelleux-M\xe8re'
Wenn ich tue:Wie dekodiert man ein Nicht-Unicode-Zeichen in Python?
In [14]: unicode(s)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
Ähnlich, wenn ich versuche, diese zu entschlüsseln, indem s.decode()
mit ihm gleichen Fehler zurückgibt.
In [13]: s.decode()
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
So dekodieren Sie solche Zeichenfolge in Unicode.
es wird mir in alle Situation helfen? Gibt es eine generalisierte Lösung? – user12345
Können wir diese Zeichen wie '\ x' in meinem Beispiel von der ursprünglichen Zeichenfolge entfernen. – user12345
@alis: Sie könnten chardet (http://chardet.feedparser.org/) verwenden, um die Codierung zu erraten. – johnbaum