Ich versuche, die Daten entsprechend Tabelle 5 auf den folgenden Link zu kratzen: https://www.fbi.gov/about-us/cjis/ucr/crime-in-the-u.s/2013/crime-in-the-u.s.-2013/tables/5tabledatadecpdf/table_5_crime_in_the_united_states_by_state_2013.xlsScrape Website-Daten unter Verwendung rvest
Wie vorgeschlagen, habe ich SelectorGadget die entsprechende CSS-Spiel zu finden, und die, die ich fand alles, was enthalten ist die Daten (sowie einige Fremd Informationen) war „#page_content“
ich den folgenden Code habe versucht, die Ausbeute Fehler:
fbi <- read_html("https://www.fbi.gov/about-us/cjis/ucr/crime-in-the-u.s/2013/crime-in-the-u.s.-2013/tables/5tabledatadecpdf/table_5_crime_in_the_united_states_by_state_2013.xls")
fbi %>%
html_node("#page_content") %>%
html_table()
Error: html_name(x) == "table" is not TRUE
#Try extracting only the first column:
fbi %>%
html_nodes(".group0") %>%
html_table()
Error: html_name(x) == "table" is not TRUE
#Directly feed fbi into html_table
data = fbi %>% html_table(fill = T)
#This output creates a list of 3 elements, where within list 1 and 3, there are many missing values.
Jede Hilfe wäre sehr dankbar!
Es hat eine Schaltfläche "Download Excel", die einfacher ist. – alistaire
Ansonsten kann man mehr oder weniger die Tabelle mit 'fbi%>% read_html()%>% html_node ('table.data')%>% html_table (fill = TRUE)' bekommen, aber es ist nicht sehr hübsch. – alistaire
@alistaire Ich stimme zu, dass das Herunterladen als Excel einfacher ist. Ich möchte jedoch, dass andere meine Arbeit schnell replizieren, indem sie einfach meine .R-Datei erstellen, ohne die Daten herunterladen zu müssen. – Zslice