2017-02-07 8 views
0

Ich versuche Daten von ADM finance zu kratzen. Ich verwende rvest Bibliothek von R, um die Daten zu ziehen. Im Folgenden wird der Code, bin ichWeb scrape Daten von der Finanz-Website mit R (RVEST)

laufen
library(rvest) 
url ="https://www.e-adm.com/futr/futr_composite_window.asp" 
table1 = html(url) %>% html_nodes(".miniText tr:nth-child(1) td:nth-child(1) .smTextBlk") %>% html_nodes("table") %>%html_table 
table2 = html(url) %>% html_nodes(".miniText tr:nth-child(1) td:nth-child(2) .smTextBlk") %>% html_nodes("table") %>%html_table 

und ohne Daten

Warning message: 
'html' is deprecated. 
Use 'read_html' instead. 
See help("Deprecated") 

Mein Ziel von dieser Website alle Tabellen zu ziehen ist folgende Warnmeldung erhalten. Es wäre eine große Hilfe, wenn mir jemand mit Code helfen könnte. Danke im Voraus!

Antwort

0
library(rvest) 
url ="https://www.e-adm.com/futr/futr_composite_window.asp" 

tableList <- read_html(url) %>% 
    html_nodes(".miniText") %>% 
    html_nodes("td table") %>% 
    html_table() 

Dies erstellt eine Liste der 9 Tabellen in der verknüpften Website.

+0

Vielen Dank für Ihre Antwort. Das funktioniert. Es wäre großartig, wenn Sie erklären könnten, warum Sie die Funktion 'html_nodes()' zweimal benutzt haben? – honey

+0

Meistens für die Ordnung, kann es in 'html_nodes (". MiniText td Tabelle ") kollabiert werden – GGamba