Ich lese Joel's article about character sets und so nehme ich seinen Rat, UTF-8 auf meiner Webseite und in meiner Datenbank zu verwenden. Was ich nicht verstehen kann ist, was mit Benutzereingaben zu tun ist. Wie Joel sagt: "Es macht keinen Sinn, eine Zeichenkette zu haben, ohne zu wissen, welche Kodierung verwendet wird." Aber woher weiß ich, welche Kodierung die Benutzereingabekette verwendet? Wenn ichWoher wissen Sie, welche Kodierung der Benutzer in den Browser eingibt?
<input type="text" name="atextfield" >
auf meiner Seite habe, wie kann ich wissen, welche Codierung Ich bin von dem Benutzer zu bekommen? Was passiert, wenn der Benutzer ein spezielles ASCII-Symbol wie ♣ oder ™ oder etwas anderes eingibt? Kann ich irgendwie feststellen, dass Benutzereingaben in UTF-8 etwas nicht erkannt haben? Gibt es einen Standard für solche Dinge?
ASCII hat keine speziellen Symbole wie ♣ oder ™. Es hat nur 128 Zeichen, von denen einige Steuerzeichen sind. Es ist UTF-8, das diese Symbole hat. – hippietrail