2017-10-13 4 views
1

Ich muss mich auf einer Webseite mit Web Scraping einloggen, aber es muss auch ein Captcha gelöst werden. Ich kann das Captcha lösen. Ich habe Probleme beim Fortsetzen der Sitzung.Python Web Scraping Login mit Captcha

session = requests.Session() 
html = session.get(url).content 
soup = bs(html, 'html.parser') 
name = soup.find('input', attrs={'id':some_id1}) 
pass = soup.find('input', attrs={'id':some_id2}) 
captcha = soup.find('input', attrs={'id':some_id3}) 

Danach löse ich das Captcha.

credentials = { 
     some_id1 : username, 
     some_id2 : password, 
     some_id3 : captchatext, 
    } 

Ich weiß nicht, wie man mit den Sitzungen gehen weiter, kam ich mit dem Code unten, aber es funktioniert nicht. Ich habe auch nach verschiedenen Antworten gesucht, aber keine von ihnen funktioniert.

session.post(url, data=credentials) 
response = session.get(url).content 
soup2 = bs(response, 'html.parser') 

Ich muss Daten von einer URL abrufen, die nach einer erfolgreichen Anmeldung geöffnet wird.

Antwort

0

Verwenden Sie die DEV-Tools Ihres Browsers, um die Anforderungen zu prüfen, die für diese spezifische URL ausgeführt wurden. Sie werden eine Anforderungs-URL finden, die Sie in der Post-Methode zusammen mit den Nutzdaten, d. H. Credentials, übergeben müssen. Dann erhalten Sie eine korrekte Antwort.