Ich versuche, dynamischen Inhalt von einem Blog durch Selenium zu verwerfen, aber es gibt immer un gerenderten JavaScript zurück.Scrapping dynamischer Inhalt durch Selen?
Um dieses Verhalten zu testen, habe ich versucht zu warten, bis Iframe vollständig geladen und gedruckt seinen Inhalt, der gut druckt, aber wieder wenn ich zurück zum übergeordneten Frame zeigt es nur un gerenderten JavaScript.
Ich suche nach etwas, in dem ich in der Lage vollständig gerenderte HTML-Inhalt
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions
driver = webdriver.Chrome("path to chrome driver")
driver.get('http://justgivemechocolateandnobodygetshurt.blogspot.com/')
WebDriverWait(driver, 40).until(expected_conditions.frame_to_be_available_and_switch_to_it((By.ID, "navbar-iframe")))
# Rendered iframe HTML is printed.
content = driver.page_source
print content.encode("utf-8")
# When I switch back to parent frame it again prints non rendered JavaScript.
driver.switch_to.parent_frame()
content = driver.page_source
print content.encode("utf-8")
weil '.page_source' die Quelle zurückkehrt, wie die DOM – Fabricator
@Fabricator nicht kann ich die aktualisierte DOM erhalten: ed bevor die
page_source
bekommen? –@UmarIqbal, Haben Sie versucht, das Element mit einer der Methoden 'find_element' auszuwählen? – DuckPuncher