Ich habe Unicode-Zeichenfolgen (aus einer API-Abfrage), die als reguläre ASCII-Zeichenfolgen codiert sein sollten (da sie bereits Unicode-Darstellungen enthalten). Wie kann ich die Kodierung ändern, ohne tatsächlich die zu kodierenden Zeichen zu ändern?Python: unerwünschter Unicode-Typ
Nämlich:
string = '165\xc2\xba F' # What I want
print(string)
my_string = u'165\xc2\xba F' # What I have
print(my_string)
PS I \xc2\xba
realisieren ist eigentlich für Ordnungszahl und nicht der Grad-Zeichen (\xc2\xb0
), aber das ist, was ich bekam.
'u'165 \ xba F'' ist die Ausgabe, die ich für Ihre Eingabe erhalten habe. Nur wenn ich das drucke habe ich die gewünschte Ausgabe. Es ist alles sehr verwirrend. – bongbang
Vielleicht verwende ich nicht den richtigen Ausdruck, aber das 'u' bezeichnet meine Zeichenfolge nicht unbedingt als "Unicode". Ich meine, das sagt 'type (my_string)'. – bongbang
Dank Ihrer Antwort habe ich festgestellt, dass 'mein_String.encode ('latin1')' mir geben wird, was ich will. Sehr geschätzt! – bongbang