2010-07-28 4 views
5

Gibt es eine einfache/leichtgewichtige Lösung, um mindestens einige Nicht-ASCII-Symbole in entsprechende ASCII-Analoga zu ändern? Zip-Tools nicht zuverlässig unterstützt UTF-8, daher die Notwendigkeit zur Herabstufung: Zum Beispiel dieser ZeichenfolgeNicht-ASCII-Symbole auf das nächstliegende 7-Bit-ASCII-Äquivalent herabstufen (vorzugsweise Java)

abc-åäö.txt 

sollten

abc-aao.txt 

Ein bisschen Hintergrund geändert werden. AFAICR Google "Anhänge als einzelne Zip-Datei herunterladen" -Funktion ersetzt alle nicht-ASCII-Symbole durch das Zeichen "_".

PS: der Code könnte auch in einer anderen Sprache sein, wenn es mehr oder weniger verständlich ist, werde ich das nach Java portieren. PPS: meine erste Frage so weit, also bitte nicht minus mich unter der Erde in Ordnung?

+2

mögliches Duplikat von [Konvertieren von Symbolen, Akzentbuchstaben in englisches Alphabet.] (Http://stackoverflow.com/questions/1008802/converting-symbols-accent-letters-to-english-alphabet) – McDowell

+0

Wie also würden wir fortfahren? , schließen Sie das als Duplikat? Fragen sind anscheinend ziemlich nah, aber ich war noch nicht in der Lage, das zu sehen, bevor ich meine ... –

+0

mögliche Duplikate von [Ersetze nationale Zeichen mit ASCII Äquivalent.] (Http://stackoverflow.com/questions/3194516/replace-national-) Zeichen-mit-Ascii-Äquivalent) – dan04

Antwort

1

Vielleicht this würde tun?

+0

danke für die Referenz, aber ich sehe nicht den tatsächlichen Code dort, anscheinend ist dies entweder bereits ein Teil von JRE (das java.text.Normalizer oder etwas ähnliches) oder nicht eine leichte Lösung ... –

0

Wenn man bedenkt, würde python verwenden, gibt ein ziemlich gutes python-Paket unidecode, genannt ist, die die ASCII translite bekommen Rationen von Unicode-Text.

Verwandte Themen