2009-02-06 16 views

Antwort

27

Wenn die Codierung korrekt eingestellt ist (und das Dokument als UTF-8 gespeichert wird), sollten Sie nur mit den Zeichen arbeiten können. Aus dem W3C:

Eine Codierung wie UTF-8 bedeutet, dass Sie die meisten Escapes vermeiden und nur mit Zeichen arbeiten können.

http://www.w3.org/International/questions/qa-escapes

Allerdings müssen Sie noch Einheiten für Sonderzeichen verwenden, wie bei größer/kleiner.

4

Meiner Erfahrung nach, solange Ihre Daten wirklich UTF-8 sind und Sie dem Browser korrekt mitteilen, dass es sich um UTF-8 handelt, müssen Sie keine Entitäten verwenden. Außer für Dinge wie & gt; & lt ;, & quot; Na sicher.

7

Entitäten sind nützlich in Programmquellcodedateien (in Programmen, die HTML ausgeben). Viele Kodierungsstandards sagen, dass Dateien in reinem ASCII sein sollten. Außer natürlich die Dateien, die tatsächlich den textuellen Inhalt enthalten - zum Beispiel .po-Dateien mit Übersetzungen.

Wenn Sie eine lange Datei mit wenigen Nicht-ASCII-Zeichen haben, ist es extrem einfach, die Datei in falscher Kodierung zu speichern, ohne zu bemerken, dass Ihre Zeichen geschraubt wurden.

Ein weiterer guter Grund, Nicht-ASCII-Zeichen zu verwenden, sind ähnlich aussehende Zeichen. Können Sie den Unterschied zwischen den nächsten beiden Codezeilen erkennen:

print "<title>" + pagename + " – " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

die aber von dem Unterschied liegt auf der Hand:

print "<title>" + pagename + " &ndash; " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

Aber außerhalb der Programmquellcodedateien, UTF-8 ist eindeutig die Weg zu gehen.

Verwandte Themen