2016-04-08 5 views
0

Wie erweitern Sie die Liste (+) von der Webseite und erhalten Sie den Titel und Timings? Ich bin neu im Web Scraping, also bitte mich leiten.Web Scraping mit Python -Wie interagieren Sie mit dem Objekt auf der Webseite

driver = webdriver.Firefox() 
driver.get("http://www.simplilearn.com/big-data-and-analytics/big-data-hadoop-architect-masters-program-training") 
html = driver.page_source 
soup = BeautifulSoup(html,"lxml") 

Antwort

0

Mit Selen, es ist sehr einfach. Sie müssen zuerst den xpath für die Maximierungsschaltfläche finden. Im Folgenden finden Sie ein Beispiel für die Erweiterung der Spalte "Big-Data und Hadoop-Entwickler" auf der angegebenen Seite.

elem = driver.find_element_by_xpath('//*[@id="body_content"]/div[1]/div[7]/div[1]/div[1]/ul/li[1]/div[1]/span') 
elem.click() 
+0

Aber immer noch bin ich nicht in der Lage, die Titel/Timing-Informationen zu erhalten. 'elem.click() html = driver.page_source suppe = BeautifulSoup (html," lxml ") suppen.findAll (" ul ", {'class': 'course-preview-accord bundle-course-preview course_preview_15) drucken ng-isolate-scope '}) ' – samy

+0

Hey, du kannst selen's Methode" find_elements_by_xpath "verwenden, um eine Liste von Elementen in dieser Liste zu erhalten. –

+0

Ja, ich habe das Gleiche gemacht. Aber es gibt keine Li-Liste in der Seitenquelle. Ausgabe: '[

    \ n \ n
] ' – samy