Ich studiere Crawling mit Python.Crawling nach dem Login in Python
Mein Ziel ist es, die Datei herunterzuladen.
Ich studiere jetzt login und es ist sehr schwierig.
http://www.kif.re.kr/kif2/login/login.aspx?menuid=56
Zum Beispiel muss ich mich einloggen, um Dateien von dieser Seite herunterzuladen.
Ich habe verschiedene Informationen nachgeschlagen.
http://stackoverflow.com/questions/8316818/login-to-website-using-python
Aber die Website, die ich will, scheint ein bisschen anders.
Ich konnte die meisten Websites, die keine Anmeldung erfordern, crawlen.
Allerdings kann ich Websites, die Anmeldung erfordern, nicht crawlen.
Also ich möchte wirklich diesen Teil studieren.
Mein Ziel ist es, sich anzumelden und dann den Code in HTML zum Crawlen anzuzeigen.
Unten ist mein Code. Ist das richtig?
from requests import session
# ex) ID = abcd/PW = 1234
payload = {
'ctl00$ContentPlaceHolder1$tbxLoginID' : 'abcd',
'ctl00$ContentPlaceHolder1$tbxLoginPW' : '1234'
}
with session() as c:
c.post('http://www.kif.re.kr/kif2/login/login.aspx', data=payload)
response = c.get('What should I write here?')
# response = c.get('http://example.com/protected_page.php')
print(response.headers)
print(response.text)