Ich versuche, Kongressmitglieder Noten von der NIAC-Website zu kratzen. Hier ist ein Link von einem Beispiel Vertreter: https://www.niacaction.org/legislator-bio/?bid=C001097Web Scraping in R mit XML und Rvest
Mein Endziel ist es, einen Datenrahmen mit dem Namen des Kongressmitglieds, Zustand, abzulenken, und dann ihre Noten für die 113.-115. Kongress. Ich benutze XML und rvest, um dies zu tun. Hier ist mein Code:
####----- Load Packages -----####
library('rvest')
library('XML')
####----- Scrape -----####
url <- 'https://www.niacaction.org/legislator-bio/?bid=C001097'
nodes <- read_html(url, xpath = '//h3 | //*[contains(concat(" ", @class, "
"), concat(" ", "entry-title", " "))]')
page <- htmlTreeParse(nodes)
Wenn ich drucken, was ich genannt habe „page“ Ich bin viel mehr Informationen bekommen, als ich will. Ich verstehe nicht warum, weil ich den XPath eindeutig identifiziert habe. Jede Eingabe wäre sehr zu schätzen. Danke
Das ist genau das, was ich suchte. Danke, ich weiß das zu schätzen – Jordan