2016-06-10 6 views
0

Ich habe Scraping eine Website, die Anmeldung erfordert und es nicht alle erforderlichen Informationen zu erhalten. Also dachte ich, es wäre das Beste, zum Anfang zurückzukehren und den gesamten HTML-Code anzuzeigen, der von der SeitePython: Zeige alle HTML in html.fromstring

stammt. Wie könnte ich das tun? unten ist meine anfängliche Idee, aber was fehlt mir, damit ich debuggen kann?

browser.get('http://www.racingpost.com' + link) 
      tree = html.fromstring(browser.page_source) 
      print(tree) 

Antwort

1

Nun können Sie aus dem browser.page_source drucken erneut:

print(browser.page_source) 

Wenn der Browser nach dem Aufstehen die .page_source geschlossen wurde, können Sie es in eine Variable merken und später ausdrucken:

browser.get('http://www.racingpost.com' + link) 
# ... 
source = browser.page_source 
browser.close() 

print(source) 

Oder können Sie den Baum zurück zu String über .tostring() Dump:

print(html.tostring(tree)) 

Es hat auch die ziemlich Druck umgesetzt:

print(html.tostring(tree, pretty_print=True))