In Python 2.7 Ich habe dies:UnicodeDecodeError: 'utf8' Codec Byte nicht dekodieren kann "0xC3"
# -*- coding: utf-8 -*-
from nltk.corpus import abc
with open("abc.txt","w") as f:
f.write(" ".join(i.words()))
ich dann versuchen, in diesem Dokument in Python zu lesen 3:
with open("abc.txt", 'r', encoding='utf-8') as f:
f.read()
nur zu erhalten:
File "C:\Python32\lib\codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 633096: invalid continuation byte
Was ich falsch gemacht habe? Notepad ++ scheint anzuzeigen, dass das Dokument Unicode utf-8 ist. Selbst wenn ich versuche, das Dokument in dieses Format mit Notepad ++ zu konvertieren, bekomme ich diesen Fehler in Python 3, was seltsam ist, da ich viele andere utf-8-codierte Dokumente ohne Probleme lese.
Was sagt 'od' über die Charaktere um diese Position? –