2012-06-10 10 views
8

Ich habe eine einfache Frage - was ist der Unterschied zwischen UTF-8, UTF-16 und UTF-32? Ich weiß, dass codierte Strings unterschiedliche Größen haben, aber was sind die UTF-16 und UTF-32 für? Sollte UTF-8 in der Lage sein, alle Sprachen korrekt zu behandeln? Und wie passt UTF-7 in das?Unterschied zwischen UTF-Kodierungen?

EDIT

Ok, ich die technische Seite des Ganzen relativ verstehen, aber ich sehe immer noch keinen Grund, warum ich zum Beispiel UTF-16 statt UTF-8 in meiner Anwendung verwenden soll. Also meine Frage ist - was ist die praktische Verwendung von anderen Kodierungen dann UTF-8?

+1

Ich möchte nur ein praktisches Beispiel von UTF-32 sagen wir sagen. Hat es eine echte Anwendung? –

Antwort

2

Dieser Artikel wurde von dem berühmten Joel Spolsky erklärt es perfctly: http://www.joelonsoftware.com/articles/Unicode.html

Zitat:

Es gibt Hunderte von traditionellen Kodierungen, die nur einige Codepunkte korrekt speichern kann und alle anderen Codepunkte ändern in Fragezeichen. Einige beliebte Kodierungen von englischem Text sind Windows-1252 (der Windows 9x Standard für westeuropäische Sprachen) und ISO-8859-1, auch bekannt als Latin-1 (auch nützlich für jede westeuropäische Sprache). Versuchen Sie jedoch, russische oder hebräische Buchstaben in diesen Kodierungen zu speichern, und Sie erhalten eine Reihe von Fragezeichen. UTF 7, 8, 16 und 32 haben alle die schöne Eigenschaft, jeden Codepunkt korrekt speichern zu können.

0

Vielleicht würde die Unicode FAQ helfen?

Es gibt eine Vergleichstabelle, die einige der Unterschiede zusammenfasst.