Hier ist meine Beschreibung von Unicode. Bitte korrigieren und kommentieren.Ist das eine gute Beschreibung von Unicode?
Unicode trennt die Darstellung eines Zeichens vom Mechanismus zum Speichern eines Zeichens. Dies unterscheidet sich von ANSI, bei dem jedes Zeichen durch ein Byte repräsentiert wird.
Eine ANSI-Codepage bildet Zeichen in Bytedarstellungen ab. Unicode ordnet Zeichen den Codepunkten zu. Ein Codepunkt ist ein abstraktes Konzept. Es liegt in der Verantwortung des Codierungsschemas, die Unicode-Codepunkte in Bytes darzustellen.
Es gibt viele Unicode-Codierungsschemas. Einige Codierungsschemas verwenden eine feste Anzahl von Bytes, um einen Unicode-Codepunkt darzustellen. Dieser Ansatz muss die Anzahl der Codepunkte, die die Codierung darstellen kann, und die Menge des benötigten Speicherplatzes ausgleichen. Andere Codierungsschemas verwenden eine variable Anzahl von Bytes, um einen Unicode-Codepunkt darzustellen. Dieser Ansatz verkompliziert das Parsen der Daten, vermeidet jedoch die Einschränkung 'Umfang der Darstellung'/'Speicherplatz', die feste Byte-Längencodierungen erleiden.
UTF-8 ist die am häufigsten verwendete Unicode-Codierung. Die Popularität von UTF-8 ist darauf zurückzuführen, dass es mit ASCII kompatibel ist. ASCII ist eine Teilmenge von ANSI, die das englische Alphabet, Ziffern und übliche Interpunktion enthält. UTF-8 ist eine Codierung mit variabler Länge und kann alle Unicode-Codepunkte codieren.
Nicht Programmierung bezogen –
??? Wie ist Unicode nicht programmiert? – Treb
@Binary - Wenn Unicode nicht programmiert ist, worauf bezieht es sich dann? –