2016-04-09 13 views
0

Ich arbeite mit URL lib2 und ich brauche eine Hilfe. Wenn ich die Informationen, die ich brauche von der Website, es funktioniert gut, aber wenn die Informationen auf der Website geändert, das Ergebnis immer noch das gleiche, Ich denke, dass ich eine Möglichkeit finden muss, den "Cache" oder " lib.close "... Ich weiß nicht ... Könnte mir bitte jemand damit helfen? DankeBrauchen Sie eine Lösung urllib2

Hier ist der Code:

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert 

Antwort

0

urllib2 Caching nicht tun. Entweder ist ein HTTP-Proxy beteiligt oder das Caching findet serverseitig statt.

Überprüfen Sie die Antwortheader. X-Cache oder X-Cache-Lookup würde bedeuten, dass Sie über einen Proxy verbunden sind.

+0

Vielen Dank für die Antwort, Ich schaute in X-Cache und X-Cache-Lookup und ich könnte die Lösung für mich finden ... Wenn ich die Informationen auf der Website ändern und aktualisieren Sie es auf meinem Computer-Browser, Es wird sofort aktualisiert ... Weitere Informationen, die Sie mit mir teilen könnten? –

+0

Können Sie weitere Informationen/Code über Ihr Projekt in Ihrer Frage hinzufügen? Du bist der Gastgeber der Website, oder? Welchen Tech-Stack verwendest du? Dieser [user] (http://stackoverflow.com/a/10008270/6079540) musste seinen Useragent spoofen ... Und übrigens könnte man seinen Code vereinfachen, indem man ein rgx verwendet: 'import re; alert = re.findall (r '\ * {3} (. +) \ * {3}', webContent) [0] ' – dron22

Verwandte Themen