2015-06-20 11 views
5

Ich benutze diesen CodeFehler: konnte nicht funktionieren „read_html“ finden

library(rvest) 
url<-read_html("http://en.wikipedia.org/wiki/Brazil_national_football_team") 

Und ich nehme zurück diesem Fehler

Error: could not find function "read_html" 

Jede Idee, was mit diesem falsch läuft?

Auch bei mehreren Links wie diese

library(rvest) 
urls<-html("https://en.wikipedia.org/wiki/Financial_crisis", 
"https://en.wikipedia.org/wiki/Inflection", 
"https://en.wikipedia.org/wiki/Financial_crisis_of_2007%E2%80%9308" 
) 

Ich erhalte diese:

Error: is.config(config) is not TRUE 

Wie kann ich es machen zu arbeiten? Wie ist es, wenn ich diese Links in eine TXT-Datei habe?

+2

Die Funktion namens 'html()' werden. Sie verwenden wahrscheinlich eine Version von 'rvest', in der diese Version des Funktionsnamens noch existiert. Probieren Sie stattdessen 'html()'. – MrFlick

+0

@MrFlick es funktioniert! –

+0

Sie müssen Tools wie 'lapply' verwenden, um mehrere URLs zu parsen. : 'lapply (URLs, Funktion (j), html (j))'. – user227710

Antwort

6

Die Dokumentation wahrscheinlich auf die read_html() Funktion im xml2 Paket bezeichnet, die vom selben Autor, Hadley Wickham, nach der ersten Veröffentlichung des rvest Pakets geschrieben wird.

Daher müssen Sie das xml2-Paket installieren und laden Sie wie folgt vor:

install.packages('xml2') 
library('xml2') 

url<-read_html("http://en.wikipedia.org/wiki/Brazil_national_football_team")