2017-07-18 1 views
0

Ich versuche Google Suchergebnisse mit Python und Selen zu kratzen. Ich kann nur das erste Suchergebnis erhalten. Hier ist der Code, den ich verwende.scraping den Text aus dem Quellcode mit Python

 driver.get(url) 
     res = driver.find_elements_by_css_selector('div.g') 
     link = res[0].find_element_by_tag_name("a") 
     href = link.get_attribute("href") 

Wie kann ich alle Suchergebnisse erhalten?

+0

zu erhalten Was haben Sie versucht, mehr als ein Ergebnis zu erhalten? – JeffC

+0

Ich benutzte die von Andersson vorgeschlagene Lösung. – Joe

Antwort

0

Try Linkliste (nur von der ersten Seite Wenn Sie mehr Seiten kratzen müssen, müssen Sie Schaltfläche „Weiter“ in einer Schleife klicken und Ergebnisse aus folgenden Seiten anhängen.) Erhalten, wie unten:

href = [link.get_attribute("href") for link in driver.find_elements_by_css_selector('div.g a')] 

PS Sie könnten auch Lösungen von this question verwenden, um Ergebnisse als GET-Anfrage Antwort mit requests lib

+0

Danke, es funktioniert. – Joe