Also, ich finde viele Dinge über das Entfernen nicht-ASCII-Zeichen, aber nicht wirklich, sie hinzuzufügen.Testen von nicht-ASCII-Zeichen, die von Webseiten kopiert wurden
Grundsätzlich habe ich ein Textfeld, das ein Benutzer eingeben kann, und dann wird diese Zeichenfolge unter bestimmten Kontexten verarbeitet, gespeichert und präsentiert. Ich erwarte, dass der Benutzer manchmal einfach Text von anderen Webseiten kopiert und einfügt, und ich möchte sicherstellen, dass nichts, was der Benutzer in dieses Feld eingibt, etwas kaputt macht. (Ich weiß, dass dies ein potentielles Problem ist, weil ein Benutzer, der ein "das war nicht wirklich ein Ascii" war, bereits einmal die Dinge kaputt machte)
Es geht NICHT darum, nicht-ASCII-Zeichen zu entfernen! Ich möchte eine gute Liste/Datei mit möglichen Problemzeichen, die ich kopieren und einfügen kann, um sicherzustellen, dass sie korrekt verarbeitet werden. Oder zumindest eine gute Möglichkeit, diese potentiellen Kopiepaste 'Betrüger' zu finden.
den Unicode-See [Namensliste] (http: //www.un icode.org/charts/nameslist/index.html) oder der [Datenbank (Textdatei)] (http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt). –