2016-11-21 4 views
0

Also, ich finde viele Dinge über das Entfernen nicht-ASCII-Zeichen, aber nicht wirklich, sie hinzuzufügen.Testen von nicht-ASCII-Zeichen, die von Webseiten kopiert wurden

Grundsätzlich habe ich ein Textfeld, das ein Benutzer eingeben kann, und dann wird diese Zeichenfolge unter bestimmten Kontexten verarbeitet, gespeichert und präsentiert. Ich erwarte, dass der Benutzer manchmal einfach Text von anderen Webseiten kopiert und einfügt, und ich möchte sicherstellen, dass nichts, was der Benutzer in dieses Feld eingibt, etwas kaputt macht. (Ich weiß, dass dies ein potentielles Problem ist, weil ein Benutzer, der ein "das war nicht wirklich ein Ascii" war, bereits einmal die Dinge kaputt machte)

Es geht NICHT darum, nicht-ASCII-Zeichen zu entfernen! Ich möchte eine gute Liste/Datei mit möglichen Problemzeichen, die ich kopieren und einfügen kann, um sicherzustellen, dass sie korrekt verarbeitet werden. Oder zumindest eine gute Möglichkeit, diese potentiellen Kopiepaste 'Betrüger' zu finden.

+0

den Unicode-See [Namensliste] (http: //www.un icode.org/charts/nameslist/index.html) oder der [Datenbank (Textdatei)] (http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt). –

Antwort

0

Vielen Dank Tom Blodget. Nach dem Verschieben und Minimieren von Text ist im Folgenden eine Liste aller UTF-8-Zeichen, die kopiert und eingefügt werden können. (Hier ist UTF-16 und UFT-32 Listen. Ich habe keine Zeit, diese Listen in eine Textdatei zu kopieren. Wenn diese Verbindungen unterbrochen sind, verwenden Google for UFT-16 table und Google for UTF-32 table)

! "# $% &‚() * +, -./:; < =>? @ ABCDEFGHIJKLMNOPQRSTUVWXYZ []^_ `abcdefghijklmnopqrstuvwxyz {|} ~ ¡¢ £ ¤ ¥ |§¨ © ª« ¬® ° ° ± ²³'μ¶ · ¹º »¼½¾¿ÀÁÉÄÇÇÉÉÍÍÖÑÑÓÓÓÖ × ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö ÷ øùúûüýþÿĂ㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŒœŔŕŘřŚśŞşŠšŢţŤťŮůŰűŸŹźŻżŽžƒ˘˙˛~˝ - '', ‚‘ „† ‡ • ... ‰ <> € ™

Verwandte Themen