mit Python 2.5.2 und Linux Debian ich versuche, den Inhalt von einem spanischen URL zu erhalten, die einen spanischen char ('I') enthält:nicht öffnen kann Unicode-URL mit Python
import urllib url = u'http://mydomain.es/índice.html' content = urllib.urlopen(url).read()
I bin diesen Fehler:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe1' in position 8: ordinal not in range(128)
ich habe versucht, bevor die uRL übergeben, dies urllib:
url = urllib.quote(url)
und diese:
url = url.encode('UTF-8')
, aber es funktioniert nicht
können Sie mir sagen, was ich falsch mache?
Ich glaube, das inzwischen geändert hat, und bei Die wenigsten Domains können jetzt beliebige Unicode-Zeichen enthalten. – Cerin
@Cerin Art von. [IRIs können beliebige Unicode-Zeichen enthalten] (https://www.w3.org/International/articles/idn-and-iri), aber wenn Sie sie in normale URIs konvertieren, werden sie mit Punycode (für die Domain-Komponente) und Prozent-Codierung (für die Pfadkomponente). –