2009-05-30 14 views
3

Ich lese irgendwo, dass es Zeichen andere als A-Z, die ein Kleinbuchstabe Äquivalent haben, in Unicode. Welche könnten diese sein, und warum sollte ein anderer Charakter eine Groß- und Kleinschreibung brauchen?Unicode Kleinbuchstaben?

+11

А если головой подумать? – alamar

+6

Was für eine naive Frage. Hast du nicht bedacht, dass es andere Sprachen als Englisch mit anderen Alphabeten als Latein gibt? – Gumbo

+2

Alamar: Sie sollten diesen Kommentar in eine Antwort gemacht haben :) –

Antwort

9

Die englische Sprache und sogar diese seltsame Variante, amerikanisches Englisch :-), ist nicht die einzige Sprache auf dem Planeten. Es gibt einige sehr merkwürdig aussehende (zumindest denen, die mit den lateinischen Schriftzeichen vertraut sind), aber selbst auf Latein basierende haben kleinere Abweichungen.

Zwei von denen, mit denen ich mehr kenne als nur gelegentlich sind Griechisch und Deutsch:

Αα Ββ Γγ Δδ Εε Ζζ Ηη Θθ Ιι Κκ Λλ Μμ 
Νν Ξξ Οο Ππ Ρρ Σσς Ττ Υυ Φφ Χχ Ψψ Ωω 

Aa Ää Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn 
Oo Öö Pp Qq Rr Ss ß Tt Uu Üü Vv Ww Xx Yy Zz 

Aus diesem Grund sind wir nicht erlaubt Bit-Code zu verwenden, wie:

char lower = upper - 'A' + 'a'; 

nicht mehr. So etwas in einer Firma zu machen, die i18n ernst nimmt, ist in der Nähe von Entlassungsgründen. Verwenden von Unicode-fähigen toLower()/toUpper()-Typ-Funktionen ist der bessere Weg zu gehen.

+5

In Deutschland ist es noch komplizierter: Während Großbuchstabe ß in letzter Zeit einen Unicode-Codepunkt hat, gibt es wirklich keinen Großbuchstaben ß. Die einzige korrekte Darstellung von Großbuchstaben ß ist SS. Wenn Sie von Groß- in Kleinbuchstaben konvertieren, sind Sie in Schwierigkeiten, weil Sie nicht wissen, was SS in Kleinbuchstaben bedeutet: ss oder ß. (Ja, es gibt Schriften mit Großbuchstaben ß, aber das heißt nicht, dass es ein gültiges Zeichen im deutschen Alphabet ist. Ich habe es nie außerhalb der Demos für die erwähnten Schriften verwendet) –

+1

Ist ß eigentlich eine Ligatur? Es ist ein altmodisches "langes s", das mit einem Terminal s verbunden ist. Sie werden etwas Ähnliches auf Englisch in einem alten Ausdruck der Unabhängigkeitserklärung sehen ("Streben nach Glück", das wie "Glück der Glücklichen" aussieht). Vor dem computerisierten Schriftsatz waren Ligaturen von fl, fi und ffl in auf Englisch gedruckten Büchern üblich. Diese wurden nicht als einzelne Charaktere betrachtet. –

+0

Es ist eine Ligatur, ja, der Name "eszett" ist ein totes Werbegeschenk ("sz"). – paxdiablo

2

Jeder Buchstabe mit einem Akzent könnte möglicherweise einen anderen Codepunkt haben oder eine Kombination aus mehr als einem Codepunkt sein. Zum Beispiel sind »Großbuchstaben mit Kleinbuchstaben.

Der Schlüssel ist, die Standards in Bezug auf die Gebietsschemaeinstellungen Ihrer Benutzer getreu zu implementieren, oder den gleichen Effekt zu erzielen, indem Sie Systembibliotheken verwenden, die den allgemeinen Fall von toupper()/tolower() korrekt behandeln.

3

Es gibt viele Alphabete außer dem lateinischen Alphabet, das die meisten von uns gewohnt sind. Zu Beginn benötigen Sie Groß- und Kleinbuchstaben von Buchstaben und Ligaturen mit Akzenten wie Àà, È und so weiter. Es gibt auch die Vollbreitenversionen von lateinischen Zeichen, die beim Setzen von Dokumenten in asiatischen Sprachen verwendet werden (zu denen ich zu faul bin, um nachzuschlagen). Außerdem gibt es heutzutage die anderen Alphabete wie das kyrillische (Бб) und das griechische Alphabet (Δδ).

Es gibt auch die Türkei, die laut Jeff Atwood just kind of difficult ist. Die Verwendung der von Ihrer Umgebung bereitgestellten Ober-/Unterkastenfunktionen ist (normalerweise) der Weg, um mit Benutzereingabedaten zu gehen.

3

Ein Großbuchstabe ß wird in der deutschen Sprache nicht benötigt, da der Buchstabe nie als erster Buchstabe eines Namens oder eines Wortes verwendet wird. Im Übrigen werden in manchen Sprachen (Französisch?) Keine Großbuchstaben mit Akzenten verwendet, sondern nur die Variante ohne Akzent.

1

in einigen Sprachen (Französisch?) Groß akzentuierte Zeichen nicht verwendet werden, (...)
[Reiner Bakels - 10. Dezember '12 um 19:34 Uhr]

Well , Ja aber nein!

In den guten alten Zeiten der manuellen "Schrift" Seite machen, das war wahr. Da ein akzentuierter Großbuchstabe ("É" zum Beispiel) auf einer Linie zu hoch ansteigen würde, war es üblich, ihn zu ignorieren und stattdessen einfach "E" anzuzeigen. Dann erschien "des études" häufig als "DES ETUDES" (ohne Akzent).

Aber das ist nicht mehr zu empfehlen.Wann immer wir die akzentuierten Großbuchstaben bearbeiten/eingeben/veröffentlichen können, sind wir dazu eingeladen. Das offizielle "Büro de la langue française" in Quebec fördert dies seit mehr als zwei Jahrzehnten!

Dies wird besonders wichtig in unserer Ära der Computer und des Internets, wo Texte mehr und mehr verarbeitet werden (lesen Sie & übersetzt) ​​von Maschinen. Das Weglassen von Akzenten kann die Bedeutung völlig verändern. tache (fleck) -vs-tâche (aufgabe), du (von) -vs-dû (etwas, was du zahlen musst), und viele, viele weitere worte. Fortsetzung der Großbuchstaben zu vermeiden ist definitiv keine gute Idee (obwohl Jahrhundert altes Erbe). Sie überall dort einzusetzen, wo es jetzt möglich ist, ist eine weit bessere Praxis.

Verwandte Themen