Codierungsprobleme gehören zu den ein Thema, die mich am häufigsten während der Entwicklung gebissen haben. Jede Plattform besteht auf ihrer eigenen Kodierung, höchstwahrscheinlich sind einige Nicht-UTF-8-Standardeinstellungen im Spiel. (Ich arbeite normalerweise an Linux, Standard an UTF-8, meine Kollegen arbeiten meistens auf deutschem Windows, Standardisierung zu ISO-8859-1 oder ähnlicher Windows-Codepage)So testen Sie eine Anwendung für die korrekte Codierung (z. B. UTF-8)
Ich glaube, dass UTF-8 ein passender ist Standard für die Entwicklung einer i18nable-Anwendung. Nach meiner Erfahrung werden Encoding-Bugs jedoch in der Regel spät entdeckt (obwohl ich in Deutschland bin und einige Sonderzeichen haben, die zusammen mit ISO-8859-1 einige erkennbare Unterschiede liefern).
Ich glaube, dass diejenigen Entwickler mit einem vollständig Nicht-ASCII-Zeichensatz (oder diejenigen, die eine Sprache kennen, die einen solchen Zeichensatz verwendet) einen Vorsprung beim Bereitstellen von Testdaten bekommen. Aber es muss einen Weg geben, dies auch für den Rest von uns zu erleichtern.
Was [Technik | Werkzeug | Anreiz] Menschen verwenden hier? Wie bringen Sie Ihre Mitentwickler dazu, sich um diese Probleme zu kümmern? Wie testen Sie auf Einhaltung? Werden diese Tests manuell oder automatisch durchgeführt?
Hinzufügen eine mögliche Antwort im Voraus:
ich vor kurzem fliptitle.com entdeckt habe (sie eine einfache Möglichkeit bieten zu bekommen seltsame Zeichen geschrieben „uʍop ǝpısdn“ *) und ich habe vor, sie über die Verwendung leicht nachprüfbar zu schaffen UTF-8-Zeichenfolgen (da die meisten der dort verwendeten Zeichen an einer seltsamen binären Codierposition liegen), müssen jedoch systematischere Tests, Muster oder Techniken zur Gewährleistung der UTF-8-Kompatibilität/Verwendung vorhanden sein.
Hinweis: Obwohl es eine akzeptierte Antwort gibt, würde ich gerne mehr Techniken und Muster kennen, wenn es welche gibt. Bitte fügen Sie weitere Antworten hinzu, wenn Sie mehr Ideen haben. Und es war nicht einfach, nur eine Antwort zu wählen. Ich habe die regexp-Antwort für den am wenigsten erwarteten Winkel gewählt, um das Problem anzugehen, obwohl es auch Gründe geben würde, andere Antworten zu wählen. Schade, dass nur eine Antwort akzeptiert werden kann.
Vielen Dank für Ihre Eingabe.
*), das ist „upside down“ geschrieben „upside down“ für diejenigen, die nicht die Zeichen aufgrund von Problemen mit Schriftarten
Vielen Dank für die (sehr geschätzt) Antworten bis jetzt - ich diese Frage offen halten, möchte für eine Weile für die Bewältigung des Problems möglichst viele Ideen zu sammeln. –