2017-04-25 2 views
0

Ich habe Textinhalte, die aus verschiedenen Sprachen stammen, wie Chinesisch, Hebräisch und so weiter. Durch Verwendung der Google Übersetzer-API, die den Text in "en" konvertiert. Hier ist das Problem, dass der Google-Übersetzer versagt, wenn er einige Sonderzeichen wie \ x11, \ x01 identifiziert (diese Zeichen können hier nicht angezeigt werden) und diese Datensätze fallen lassen. Bitte schlagen Sie einen sichersten Weg vor, um diese Konvertierung ohne ausfallende Datensätze durchzuführen.Nicht druckbare Zeichen mit Python trimmen

Antwort

0

data = '' .join (c für c in Daten wenn c.printable)

Verwandte Themen