2009-04-27 5 views
1

Ich bin neu zu tun mit jeder Sprache, die nicht Englisch ist. Bis jetzt war das einzige, was ich jemals mit der Programmierung gemacht habe, Eingaben in den grundlegenden englischen Buchstaben + Zahlen zu nehmen und auszugeben. Jetzt muss ich einen Text auf Russisch manipulieren (vor allem aus der russischen Wikipedia-Seite), aber ich habe keine Ahnung, wo ich anfangen soll. Ich google und google, aber alles, was ich bekomme, sind Ergebnisse, die über Unicode, UTF-8 und andere Dinge sprechen, aber diese ergeben keinen Sinn für mich, weil ich nicht sicher bin, worauf sich diese beziehen. Wikipedia-Einträge selbst scheinen für Leute geschrieben zu sein, die dieses Zeug bereits kennen.Wie kann ich mit russischem Text in Perl umgehen?

Kann mir jemand einen guten Startplatz geben?

Antwort

7

Es scheint so, als müssten Sie zuerst eine Idee davon bekommen, was Unicode ist. Joel Spolsky's Artikel The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) könnte ein guter Ausgangspunkt sein (für erfahrene Leute ist es jedoch ziemlich informativ).

Danach sollten Sie untersuchen, wie Perl Unicode behandelt, wie ein Blick auf die Perl Unicode Tutorial.

+0

Danke. Ich denke, dieser Artikel ist, was ich suchte :) – Mike

+0

Hinweis: Eigentlich ist Joels Artikel aus technischer Sicht ziemlich schrecklich und simplfies viele Dinge, die wahrscheinlich nicht sein sollten. Ich behaupte nicht, dass ich ein besseres schreiben könnte, aber ich habe schon viele Male bewiesen, dass Halbwissen tatsächlich weh tut und du wahrscheinlich nicht viel mehr haben wirst, nachdem du diesen Artikel gelesen hast. – Joey

Verwandte Themen