Verwendung von Mac OSX und wenn es eine Datei mit UTF-8 kodiert (enthält internationale Zeichen neben ASCII), fragen, ob irgendwelche Werkzeuge oder einfache Befehl (zB in Python 2.7 oder Shell) können wir die zugehörigen hex (base-16) -Werte (in Byte-Stream) finden? Wenn ich zum Beispiel asiatische Zeichen in die Datei schreibe, kann ich den zugehörigen Hex-Wert finden.erhalten UTF-8 codierten Hex-Wert für internationale Zeichen
Meine aktuelle Lösung ist ich öffne die Datei und lese sie Byte für Byte mit Python str. Fragen, ob irgendwelche einfacheren Möglichkeiten ohne Codierung. :)
Edit 1, es ist die Ausgabe von od
scheint nicht korrekt ist,
cat ~/Downloads/12
1
od ~/Downloads/12
0000000 000061
0000001
Edit 2 versuchte od -t x1
Optionen auch,
od -t x1 ~/Downloads/12
0000000 31
0000001
Vielen Dank im Voraus, Lin
nicht sicher, was Sie durch "related hex" bedeutet in diesem Fall. Mit der Terminal.app in Mac OS X mit einer Bash-Shell ist es einfach, nach Unicode-Zeichen außerhalb des US-ASCII-Bereichs zu suchen. Etwas wie: 'grep 中国 cn.txt' Versuchen Sie, linguistisch ähnliche Zeichen zu finden, in der Nähe eines Codepunktbereichs oder etwas anderem? –
@LexScarisbrick, schönes Beispiel. Der Hex-Wert I bedeutet die realen Byte-Werte, die als UTF-8 codiert sind. Der Grund, warum ich Hexadezimalwert erhalten möchte, liegt darin, dass ich möglicherweise in Python 2.7 Variablenwerte wie '\ xE3 \ x80 \ x82' zuweisen muss, die die Byte-Werte Hex-Form für ein Unicode-Zeichen sind. Ich mache nicht Grep. Wenn Sie irgendwelche Ideen haben, wird es großartig. –
'od' ist das POSIX-Hex-Dump-Tool. Keine Programmierfrage; Wählen zu schließen. – tripleee