Ich versuche, eine dynamische Website Morningstar.com über XHR-Anfragen zu kratzen.Web Scraping XHR Dynamische Seiten mit Resten und R
Die genaue Stelle ich Schaben bin ist: http://performance.morningstar.com/funds/etf/total-returns.action?t=SPY®ion=USA&culture=en_US
Was ich versuche, die Quarterly Leistungszahl (1-Monat) zu kratzen ist. Das Ergebnis sollte ab heute 0,64 betragen.
try(res <- GET(url = "http://performance.morningstar.com/fund/performance-return.action",
query = list(
t="SPY",
region="usa",
culture="en-US"
)
))
tryCatch(x <- content(res) %>%
html_nodes(xpath = '//*[@id="tab-quar-end-content"]/table/tbody/tr[1]/td[1]') %>%
html_text() %>%
trimws() %>%
as.numeric()
, error = function(e) x <-NA)
jedoch das Ergebnis numerisch (0)
Jede Idee, was ich falsch mache?
Sody
Update:
konnte ich die HTML-Daten mit dem folgenden Code erhalten:
try(res <- GET(url = "http://performance.morningstar.com/fund/performance-return.action",
query = list(
t = "SPY",
region = "usa",
culture = "en-US",
ops = "clear",
s = "0P0000J533",
ndec = "2",
ep = "true",
align = "q",
annlz = "true",
comparisonRemove = "false"
)
))
Aber ich bin immer noch Probleme mit den Daten zeigen entweder die CSS-Selektor oder der Xpath mit Rvest.
Was verwenden Sie, um diese Datenpunkte zu finden? Ist SelectorGadget immer noch der richtige?
Cheers, Aaron
Sie sollten in Betracht ziehen, Ihre Frage zu aktualisieren oder Antworten zu posten. – hrbrmstr
Guter Punkt! Neu dazu. –