C# UTF-8 von Bytes Verwirrung

2017-02-14 6 views 0 likes

System.Text.Encoding.UTF8.GetString(new byte [] { (byte)0xa0 });

nicht dazu führen,

"\u00a0"

Ich bin zurück "\ufffd" stattdessen.

Nach https://en.wikipedia.org/wiki/Non-breaking_space sollte 0xa0 in UTF-8 ein gültiger, nicht brechender Platz sein.

Quelle

2017-02-14 CoderBrien

Antwort

0xa0 sollte in UTF-8 ein gültiges, nicht brechendes Leerzeichen sein.

Nein, ist es nicht. Dies gilt sowohl in Latin1 als auch in Unicode (oder UTF-16 und UTF-32) Zeichensätzen.

In UTF-8-Codierung ist es codiert als C2 A0. Im Allgemeinen werden nur Zeichen, die kleiner als 0x80 sind, in UTF-8 einem einzelnen Byte zugeordnet.

Quelle

2017-02-14 02:33:51

ah, danke. Also, wenn ich 8 Byte Text mit einem 0xa0 Byte habe, das ein Leerzeichen sein soll, dann ist es wahrscheinlich Latin1 Kodierung? – CoderBrien

Es gibt mehrere Codierungen, die U + 00A0 bis 0xA0 abbilden. Latin-1 (das wiederum zwischen der ISO- und Windows-Codierung dieses Namens nicht eindeutig ist) ist eine wahrscheinliche Wette, aber nicht sicher. –

@CoderBrien: Höchstwahrscheinlich. Oder irgendwelche anderen altmodischen Ein-Byte-Kodierungen. –

Verwandte Themen

1. Bitverschiebung Verwirrung in C#
2. C-Array-Adresse Verwirrung
3. Verwirrung C
4. UTF8-Verarbeitung in C
5. C Shallow Copy Verwirrung
6. C++ UTF8 Codierung
7. Pointer und Speicher Verwirrung in C
8. C# Initialisierung Verwirrung!
9. Konvertieren von Problem ANSI zu UTF8 C#
10. C# versteckt Verwirrung
11. C++ Variable Verwirrung
12. C++ Ausnahmebehandlung Verwirrung
13. O-Notation Verwirrung (C++)
14. C++ Klassen/Verwirrung
15. C++: Wie Ersatzzeichen in utf8
16. Speichern einer Zeichenfolge als UTF8 in C#
17. Korrekt behandeln utf8 Zeichenfolge empfangen von json.net
18. C Statische Funktion Verwirrung
19. Einfache C Zeiger Verwirrung
20. C++ Lambda Ausdruck Verwirrung
21. C++ Pointers Verwirrung
22. Elementary C++ Typ Verwirrung
23. Datentyp Verwirrung in C
24. C++ boolalpha Verwirrung
25. Bytes in Vektor C++
26. C zu MIPS Assembly Verwirrung
27. C++: Verwirrung über Weiterleitung Referenz
28. C# MVC - Routing Problem/Verwirrung
29. Verwirrung über Zeichenzeiger in C
30. Verwirrung auf C# Zeichenfolge Literale