2016-04-14 17 views
1

Ich habe eine Beizdatei, die beim Lesen die Unicode-Zeichen enthält. Wenn ich die Zeichenfolge drucke, gibt es die folgende Ausgabe als catu\u1e63\u1e6daya und wird als str Typ gespeichert. Wenn ich die gleichen Zeichen für Zeichen drucke, bekomme ich Folgendes.Umwandlung von Unicode-Zeichen in Unicode-Notation

c 
a 
t 
u 
\ 
u 
1 
e 
6 
3 
\ 
u 
1 
e 
6 
d 
a 
y 
a 

Ich habe decode versucht, encode und de-encode Methoden. Ich habe auch die unicode Methode versucht. Gibt es eine Möglichkeit, die genauen Informationen abzurufen?

Antwort

1

dekodieren mit "unicode-escape":

s.decode("unicode-escape") 

Welche gibt Ihnen:

In [17]: print s.decode("raw_unicode_escape") 
catuṣṭaya