Hier ist die Testdatei - rime.txt.Wo sind die zwei Zeichen wann mit awk zu zählen?
file rime.txt
rime.txt: UTF-8 Unicode text
wc -c rime.txt
25483 rime.txt
awk '{num=num+length($0)}END{print num}' rime.txt
24648
Länge ($ 0) enthalten Leerzeichen, enthalten keine Newline (0a).
awk 'END{print NR}' rime.txt
833
Es gibt 833 0a --newline in rime.txt.
echo "25483-24648-833" |bc
2
Wo sind die beiden Zeichen awk, die nicht zählen können?
wc -m rime.txt
25481 rime.txt
Es gibt zwei Bytes, die alle Zeichen den Plan nicht sehen, was sind sie?
Wie finde ich es heraus?
'wc -c' zählt Bytes, keine Zeichen. Haben Sie Multi-Byte-Codierung? – heemayl
Datei rime.txt ----- rime.txt: UTF-8 Unicode-Text –
Versuchen Sie mit 'wc -m' – heemayl