2009-07-26 19 views
1

Ich arbeite im Grunde mit einer oldschool-PHP-basierten Website in russischer Sprache, eine der vielen neuen Funktionen ist Permalinks.Permalinks mit russischen/kyrillischen Nachrichten

Ab sofort verwendet die Website derzeit nur die Standard-non-mvc 'article.php? Id = 50'. Ich habe die Russian wiki angesehen und das war wirklich die einzige russische Seite, die ich gesehen habe, die von einheimischen russischen Permalinks Gebrauch gemacht hat. Ich frage mich:

  1. Gibt es irgendwelche Einschränkungen in Bezug auf die Verwendung von Zeichen? Benötigt dies irgendeine Art von speziellen Setup auf der Serverseite oder irgendetwas?
  2. Auf welche Art von Zeichen sollte ich generell bei Permalinks achten? Irgendwelche Gotchas, die ich brauche?
  3. Irgendwelche Tipps, wie ich die Permalinks in meiner Datenbank speichern sollte? Ab sofort ist die Tabellenstruktur relativ einfach .. nur ein Artikel Tisch mit:

id article article_snippet article_whole date_time

ich das Hinzufügen einer neuen Spalte in dieser Tabelle dachte namens ‚permalink‘ denen speichert im Grunde eine modifizierte Version von article_title (bis jetzt ist das einzige Zeichen, das ich mir mit spezieller Behandlung vorstellen kann, der Speicherplatz, den ich in einen Unterstrich umwandeln werde).

  1. Wie soll ich meine neuen sauberen URLs formatieren lassen? Ich dachte, so etwas wie:

/articles/2009/Заглавная_страница

zum Beispiel.

Übrigens werde ich Pylons (ein Python Framework) und MySQL 5 verwenden, obwohl ich offen für PostgreSQL bin, wenn es irgendwelche seltsamen UTF8 Beschränkungen gibt (ich konvertierte die ganze Datenbank, die vorher Latin1 war zu UTF8 Weg mit iconv).

Antwort

2

Die aktuelle Konvention ist URLs in UTF-8, zu kodieren und dann URL-Escape (dh% -escape) sie:

py> urllib.quote(u"articles/2009/Заглавная_страница".encode("utf-8")) 
'articles/2009/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0' 

Danach wird es keine Einschränkungen geben - dh Browser Entweder erkennen sie es als UTF-8 oder nicht, aber sie werden dem Link sicher folgen können.

+0

Interessante Technik. –

Verwandte Themen