2017-11-26 1 views
-3

Hallo i tabellarische Informationen aus der folgenden Seite auf Asset Allocation, Style Details, Sektorengewichtung & Regionen der WeltScraping Tabellen von Link in R

http://portfolios.morningstar.com/fund/summary?t=SPY&region=usa&culture=en-US&ownerCountry=USA

ich kratzen wollen, müssen Sie den folgenden Code, der einen Fehler gibt

turl = 'http://portfolios.morningstar.com/fund/summary?t=SPY' 
test_html = read_html(turl) 
df<-html_table(test_html, fill = TRUE) 

Antwort

0

In den Beispielen von ?html_table ist das folgende Beispiel:

births <- read_html("https://www.ssa.gov/oact/babynames/numberUSbirths.html") 
html_table(html_nodes(births, "table")[[2]]) 

Die Anpassung an Ihren Fall scheint den Fehler zu beheben. Sie müssen möglicherweise die [[2]]] je nach genau was Sie wollen ändern.

library(rvest) 
turl = 'http://portfolios.morningstar.com/fund/summary?t=SPY' 
test_html = read_html(turl) 
df<-html_table(html_nodes(test_html, 'table')[[2]]) 
+0

Danke, Sehr hilfreich. Ich bekomme immer noch den gleichen Fehler für eine der Tabellen, aber für den Rest von ihnen kann ich damit kratzen –