2010-04-24 20 views

Antwort

32

Ja, das ist richtig. UTF-8 ist eine Kodierung für den Unicode-Zeichensatz, der so ziemlich jede Sprache der Welt unterstützt.

Ich denke, der einzige Unterschied kommt mit der Sortierung Ihrer Ergebnisse, andere Buchstaben könnten in einer anderen Reihenfolge in anderen Sprachen kommen (Akzente, Umlaute, etc.). Auch der Vergleich von a mit ä könnte sich in einer anderen Kollatierung anders verhalten.

Das Suffix _ci bedeutet, Sortierung und Vergleich geschieht case insensitive.

http://www.collation-charts.org/ könnte für Sie von Interesse sein.

+1

Vielen Dank Kumpel :) eine weitere Frage: Sie meinen, wenn ich utf8_general Kollatierung auswählen, dann wird es ein Problem sein, meine Datensätze sowohl in Englisch und Persisch oder andere Langs zu sortieren? –

+1

Englisch und Französisch sollten so ziemlich gleich sortieren, ich weiß nicht über die anderen (persisch, arabisch, japanisch, chinesisch), weil sie nicht die normalen englischen Zeichen verwenden. Wie magst du es, dass sie sortieren? nach englischen Buchstaben, dazwischen, vorher? weißt Du, was ich meine? – knittl

+0

Nein, ich meine persische Zeichen auf seine Art zu sortieren. es bedeutet die gleiche Weise wie das Sortieren englischer Alphabete wie A, B, C, ... wird es mit dieser Sortierung falsch arbeiten? –

Verwandte Themen