2016-12-14 4 views
-1

Ich versuche, eine Tabelle der US-Hub-Flughäfen aus der Liste auf der Wikipedia-Seite (10) mit R zu erstellen. Ich bin neu im Web Scraping, so dass jede Hilfe oder Beratung zu diesem Thema würde geschätzt werden. Ich versuche, einen Tisch ähnlich dem folgenden mit den Informationen von jedem US-Staat zu bekommen.R- Scraping Wikipedia Liste in einer Tabelle

Example of airport hub table

Dank!

+0

Diese Frage ist sehr breit. Das Ziehen der Daten und das Parsen ist ein Projekt für sich. Bitte bitten Sie niemanden, Ihre Arbeit für Sie abzuschließen. Dies ist kein Code-Schreibdienst. Wenn Sie einen allgemeinen Tipp zu einem Aspekt des Projekts haben möchten, mit dem Sie besonders Probleme hatten, beschränken Sie Ihre Frage bitte darauf. –

+0

Wenn Sie nur nach Informationen über die Standorte von Flughäfen suchen, sollten Sie diese Frage und Antwort in Betracht ziehen: http://stackoverflow.com/questions/37572731/using-a-api-to-calculate-distance-between-two- airports-two-columns-in-r – Dave2e

+0

Dies ist die Art von Aufgabe, die erfahrene R-Benutzer gerne für Sie erledigen würden.] (https://www.r-users.com/) –

Antwort

0

Obwohl das gesamte Projekt eine Herausforderung sein wird, ist hier ein Anfang, um die US-Daten zu ziehen.

library(rvest) 
site <- "https://en.wikipedia.org/wiki/List_of_hub_airports" 
txt <- read_html(site) %>% 
    html_nodes("#mw-content-text :nth-child(1)") %>% 
    html_text() 
usatext <- txt[1866:2329]