WarumC# UTF-8 von Bytes Verwirrung
System.Text.Encoding.UTF8.GetString(new byte [] { (byte)0xa0 });
nicht dazu führen,
"\u00a0"
?
Ich bin zurück "\ufffd"
stattdessen.
Nach https://en.wikipedia.org/wiki/Non-breaking_space sollte 0xa0 in UTF-8 ein gültiger, nicht brechender Platz sein.
ah, danke. Also, wenn ich 8 Byte Text mit einem 0xa0 Byte habe, das ein Leerzeichen sein soll, dann ist es wahrscheinlich Latin1 Kodierung? – CoderBrien
Es gibt mehrere Codierungen, die U + 00A0 bis 0xA0 abbilden. Latin-1 (das wiederum zwischen der ISO- und Windows-Codierung dieses Namens nicht eindeutig ist) ist eine wahrscheinliche Wette, aber nicht sicher. –
@CoderBrien: Höchstwahrscheinlich. Oder irgendwelche anderen altmodischen Ein-Byte-Kodierungen. –