Der Inhalt einer Datei ist wie folgt, und die Datei-Codierung ist utf-8:gelesenen Bytes Zeichenfolge aus der Datei in python3
cd232704-a46f-3d9d-97f6-67edb897d65f b'this Friday, Gerda Scheuers will be excited \xe2\x80\x94 but she\xe2\x80\x99s most excited about the merchandise the movie will bring.'
Hier ist mein Code:
with open(file, 'r') as f_in:
for line in f_in:
tokens = line.split('\t')
print(tokens[1])
Ich möchte die richtige Antwort bekommen - "Diesen Freitag wird Gerda Scheuers begeistert sein - aber sie freut sich am meisten über die Merchandise, die der Film bringen wird."
print(b'\xe2\x80\x94'.decode('utf-8')) #convert into ASCII
Aber ich kann nicht die Bytes aus einer Datei lesen. Wenn ich eine Datei mit Bytes öffne, muss ich die Zeile dekodieren, um sie zu teilen.