Es gibt nicht so etwas wie eine Textdatei mit einem Bündel von Unicode-Zeichen, es macht nur Sinn, über ein „Unicode-Objekt“ zu sprechen, sobald die Datei gelesen wurde und in Python-Objekte dekodiert. Die Daten in der Textdatei sind auf die eine oder andere Weise codiert.
So ist das Problem über das Lesen der Datei in der richtigen Weise, um die Zeichen zu Unicode-Objekten korrekt zu dekodieren.
Oben Ich nehme an, die Ziel-und Quelldatei-Kodierungen sind beide utf-8. Dies ist nicht unbedingt der Fall, und Sie sollten wissen, wofür die Quelldatei codiert ist. Sie können wählen enc_target
, aber jemand muss Ihnen enc_source
sagen (die Datei selbst kann es Ihnen nicht sagen).
Können Sie den Code einbeziehen, den Sie bisher ausprobiert haben? –