Ich habe den folgenden Befehl, um Unicode-Zeichen durch ASCII-Zeichen zu ersetzen.So ersetzen Sie Unicode-Zeichen durch ASCII
sed -i 's/Ã/A/g'
Das Problem ist Ã
nicht durch den sed Befehl in meiner Unix-Umgebung erkannt wird, damit ich Sie es mit seinem hexadezimalen Wert ersetzen würde annehmen. Wie würde die Syntax aussehen, wenn ich stattdessen C3
verwenden würde?
ich diesen Befehl als Vorlage für andere Zeichen verwende ich möchte mit Leerzeichen ersetzen, wie zum Beispiel:
sed -i ‚s/©// g‘
meinst du das? http://stackoverflow.com/questions/22450563/sed-matching-unicode-block-with – Leo
Welchen Zeichensatz verwendet Ihr Terminal? Und welche Codierung verwendet der Eingabetext? Ã in UTF-8 ist 0xC3 0x83, und Zeichen 0x83 ist ein Steuercode in ISO 8859-1, also könnte das ein Problem sein. Ich nehme an, Sie können "LANG = en_US.UTF-8" nicht einfach auf Ihrem System einstellen. – yellowantphil
"sed" wird den Job machen. Bitte sehen Sie meine Antwort. – ajaaskel