Ich schreibe ein einfaches Programm, um HTML-Seiten zu vergleichen, aber mein aktueller Engpass liest die HTML-Dateien. Insbesondere der Code:Warum braucht urllib2 viel Zeit zum Lesen?
htmldata1 = urllib2.urlopen(url1).read()
htmldata2 = urllib2.urlopen(url2).read()
Die URLs sind von IMDB. Ich weiß nicht, warum es so lange dauert (durchschnittlich ~ 9 Sekunden). Es kann die Bilder herunterladen, wenn ich nur den HTML-Text mit regulären Ausdrücken suchen möchte. Ich habe nie urllib2 benutzt, also würde jede Hilfe geschätzt werden.
Edit:
Ein url Beispiel ich benutze, ist
"http://www.imdb.com/title/tt0944947/fullcredits?ref_=tt_cl_sm#cast"
Es wäre schön, wenn Sie eine tatsächliche URL geben könnten, so dass andere es versuchen und sehen, ob sie erleben das gleiche Verhalten. – Eduardo
Versucht mit 'urllib', nicht' urllib2'? –
@Eduardo gab nur ein Beispiel URL. Mein Fehler. Abien, das Problem bestand sowohl mit Urlib als auch mit Urlib2. – jman