2012-03-31 4 views
0

Ich schreibe eine einfache Abfrage, um URLs auf commons.wikimedia.org zu finden, aber ich kann nicht scheinen, welche spezifischen Desinfektionsregeln ich verwenden sollte, um die genauen Namensdateien zu erhalten, die dort verwendet werden.Welche spezifischen Desinfektionsfunktionen werden in Wikimedia-URLs verwendet?

ZB: Die Flagge der Elfenbeinküste ist in Französisch als Drapeau_de_la_Côte_d%27Ivoire aufgeführt, so bekomme ich es, dass Apostrophe werden saniert, aber die regelmäßige ô ist nicht. Ich habe viele andere Dateinamen mit Sonderzeichen erhalten.

Ist es sicher anzunehmen, dass alle Sonderzeichen erhalten bleiben und alle Interpunktionszeichen und/oder Nicht-Buchstaben bereinigt werden?

+0

Browser tut, nicht Wikepedia. Browser sendet URLs nur in ascii-safe-Symbolen, zeigt sie aber benutzerfreundlicher an, speziell für Benutzer – zerkms

+0

, sodass auf ihrer Seite keinerlei Desinfektion stattfindet. – moraleida

+0

Ich bin mir nicht sicher, welche Art der Bereinigung Sie meinen, aber für diesen Teil senden sie nur die Daten in% nn (http://en.wikipedia.org/wiki/Flag_of_C%C3%B4te_d'Ivoire) und Ihrem Browser verschlüsselt dekodiert es zurück – zerkms

Antwort

2

Wikipedia verwendet alle URL-maskiert in %nnnn Format (nach allen URL RFCs), und Ihr Browser macht die endgültige Arbeit für Sie, nur um die URLs freundlicher zu haben.

Also auch wenn meine Chrom http://en.wikipedia.org/wiki/Flag_of_Côte_d'Ivoire url zeigt, ursprünglich war es http://en.wikipedia.org/wiki/Flag_of_C%C3%B4te_d'Ivoire

+0

Super, danke! – moraleida

Verwandte Themen