2017-06-23 1 views
0

Ich mag würde die Informationen auf dieser Seite erhalten: http://www.jnfdc.gov.cn/onsaling/viewhouse.shtml?fmid=757e06e0-c5b3-4384-9a14-2cb1eac011d1ich httperror: Not Found Ausnahme, wenn ich die URL öffnen

aus dem Browser-Debugger Tools, die ich die Informationen in dieser Datei erhalten: http://www.jnfdc.gov.cn/r/house/757e06e0-c5b3-4384-9a14-2cb1eac011d1_154810896.xml

Aber wenn ich den Browser verwende, um direkt auf die URL zuzugreifen, kann ich die Datei nicht abrufen.

Ich weiß nicht warum.

Ich benutze Python.

import urllib2 

#url1 = 'http://www.jnfdc.gov.cn/onsaling/viewhouse.shtml?fmid=757e06e0-c5b3-4384-9a14-2cb1eac011d1' 
url = 'http://www.jnfdc.gov.cn/r/house/757e06e0-c5b3-4384-9a14-2cb1eac011d1_113649432.xml' 
headers = { 
    "Accept" :"*/*", 
    "Accept-Encoding" :"gzip, deflate, sdch", 
    "Accept-Language" :"zh-CN,zh;q=0.8", 
    "Cache-Control" :"max-age=0", 
    "Connection" :"keep-alive", 
    "Cookie" :"JSESSIONID=A205D8D7B0807FD34F879D6CB6EEB0CE", 
    "DNT" :"1", 
    "Host" :"www.jnfdc.gov.cn", 
    "Referer" :"http://www.jnfdc.gov.cn/onsaling/viewhouse.shtml?fmid=757e06e0-c5b3-4384-9a14-2cb1eac011d1", 
    "User-Agent" :"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3051.400 QQBrowser/9.6.11301.400" 
    } 

req = urllib2.Request(url, headers=headers) 

resp = urllib2.urlopen(req) #this code throw exception:HTTPError: Not Found 

Wie könnte ich tun? Vielen Dank.

Antwort

0

Um Daten aus dem Browser zu erhalten, können Sie Selenium - Selenium doc

verwenden