mit rvest Ich bin mit der Tabelle auf der folgenden Seite zu extrahieren:Scraping HTML-Tabelle mit Spannweite rvest
https://en.wikipedia.org/wiki/List_of_United_States_presidential_elections_by_popular_vote_margin
Der folgende Code funktioniert:
URL <- 'https://en.wikipedia.org/wiki/List_of_United_States_presidential_elections_by_popular_vote_margin'
table <- URL %>%
read_html %>%
html_nodes("table") %>%
.[[2]] %>%
html_table(trim=TRUE)
aber die Spalte der Margen und Präsidentennamen haben einige seltsame Werte. Der Grund dafür ist, dass der Quellcode folgende Voraussetzungen erfüllt sein:
<td><span style="display:none">00.001</span>−10.44%</td>
so anstatt sich -10,44% ich 00.001â'10.44%
Wie könnte ich dieses Problem beheben?
Vielleicht auf diese jemand den gesamten Tisch zu bekommen bauen kann ... 'read_html (‘