Wenn ich eine Website, die Login mit Passwort erfordert zuerst kratzen, wie kann ich beginnen, es mit Python mit BeautifulSoup4-Bibliothek scraping? Unten ist, was ich für Websites tun, die keine Anmeldung erfordern.Wie scrappe ich eine Website, die eine Anmeldung mit Python und BeautifulSoup erfordert?
from bs4 import BeautifulSoup
import urllib2
url = urllib2.urlopen("http://www.python.org")
content = url.read()
soup = BeautifulSoup(content)
Wie sollte der Code geändert werden, um die Anmeldung zu ermöglichen? Angenommen, die Website, die ich scrappen möchte, ist ein Forum, das eine Anmeldung erfordert. Ein Beispiel dafür ist http://forum.arduino.cc/index.php
'br.form [' Benutzername '] =' Benutzername ' ist der erste' Benutzername 'der Name des Formulars und der zweite der tatsächliche Benutzername? –
@DanS. Dies ist ziemlich spät .. aber für jeden, der das sieht, ja .. der erste Benutzername ist der Name des Formularfelds .. und der zweite Benutzername wäre der tatsächliche Benutzername, den Sie in dieses Formularfeld eingeben würden. –