2017-07-06 2 views
0

Ich versuche, die Suchergebnisse von http://startpage.com/ zu kratzen, habe ich die Ergebnisse alle fertig mit BS4 und Anfragen. Ich bin auf ein Problem gestoßen, nachdem ich die Ergebnisse auskratzen konnte. Ich kann nicht zur nächsten Seite der Suchergebnisse gelangen. Ich kann keinen Link finden, der Webbrowser-Entwicklertools verwendet. Wenn ich das Element überprüfe, ist dies das, was es zeigt <a href="javascript:;" class="numbers_st" onclick="mysubmit(10); return false;" id="2">2</a> das ist die Nummer 2-Taste. Die andere Option ist die nächste Schaltfläche <a href="javascript:document.nextform.submit();" class="numbers_st" style="width:200px; text-align:left;">Next<span class="i_next"></span></a> Wie mache ich eine Anfrage oder was immer ich tun muss, um nach dem Scraping der Ergebnisse der ersten Seite auf die nächste Seite zu gelangen.Scraping Startseite mit BS4 und Anfragen

import requests 
from bs4 import BeautifulSoup 
def dork(): 
    url = 'https://www.startpage.com/do/search?cmd=process_search&query=inurl:admin&language=english_au&cat=web&with_language=&with_region=&pl=&ff=&rl=&abp=-1&with_date=m' 
    source_code = requests.get(url, 'html') 
    plain_txt = source_code.text 
    soup = BeautifulSoup(plain_txt, "lxml") 
    for text in soup.find_all('h3', {'class': 'clk'}): 
     for link in text.find_all('a'): 
      href = link.get('href') 
      print(href) 
dork() 

Das ist der Code, der die Links bekommt.

Antwort

0

Ich empfehle Ihnen, die Selenium/PhantomJS zu testen, die Ihnen die Möglichkeit geben, einen echten, kopflosen und skriptfähigen Browser zu haben. Zur Kasse gehen this answer