2010-11-28 7 views
0

Ich arbeite mit großen Dateien in Französisch und Deutsch. Grundsätzlich können Sie Zeichenketten von einer Datei in eine andere schreiben, Daten von ihnen sammeln und so weiter. Leider habe ich keine Ahnung, was ich importieren soll, damit Python mit diesen Zeichen umgehen kann.Python - Möglichkeit, fremde Zeichen im Format zu verschlüsseln, mit denen Python arbeiten kann?

Selbst wenn Daten aus Dateien zu sammeln, die Python bereits umgesetzt hat (in französisch Sie seltsame Dinge wie à © Couteur ça bekommen), erhalte ich Schlüsselfehler, wenn dicts für Dinge überprüft, die ich haben, wissen bereits platziert worden in dieses Diktat, aber nur, wenn die Elemente Sonderzeichen enthalten, wie im Beispiel von écouteur ça. Wenn zum Beispiel das Tupel ('écouteur', 'ça') zu einem Diktat hinzugefügt wurde, das die Häufigkeit auffindet, mit der ein beliebiges gegebenes Wortpaar zusammen auftritt, erhalten Sie einen Schlüsselfehler, wenn Sie das untersuchen dict für das Tupel ('é couteur', 'ça'), aber nicht, wenn das Diktat nach anderen Tupeln durchsucht wird, die die verrückten Zeichen nicht enthalten.

Kennt jemand einen schnellen Weg, um dieses Problem auf jeder Ebene zu umgehen?

Best, Georgina

+0

Können Sie ein Beispiel (Code-Schnipsel) liefern, was genau nicht funktioniert, das heißt, welche Ergebnisse Sie erhalten und welche Ergebnisse Sie erwarten. – ecik

+0

@ecik Vielen Dank. Ich fügte das dem ursprünglichen Beitrag hinzu: Wenn beispielsweise das Tupel ("écouteur", "ça") zu einem Diktat hinzugefügt wurde, das die Häufigkeit erfasst, mit der ein beliebiges gegebenes Wortpaar zusammen auftritt, erhalten Sie einen Schlüssel Fehler bei der Prüfung dieses Diktats für das Tupel ('écouteur', 'ça'), aber nicht, wenn das Diktat für andere Tupel untersucht wird, die die verrückten Zeichen nicht enthalten. – Georgina

Antwort