Ich versuche, Daten von dieser Seite zu kratzen:Scrape Daten aus dem Flash-Seite mit rvest
Wenn ich versuche, den Namen der Spieler zu kratzen die CSS-Selektor und die übliche rvest Syntax:
names <- read_html("http://www.atpworldtour.com/en/tournaments/brisbane-international-presented-by-suncorp/339/2016/match-stats/r975/f324/match-stats?") %>%
html_nodes(".scoring-player-name") %>% sapply(html_text)
alles gut geht.
Leider, wenn ich versuche, die Statistiken unten zu kratzen (zuerst dienen Punkte gewonnen, ..) mit dem Selektor .stat-breakdown span
Ich kann keine Daten abrufen.
Ich weiß, rvest wird im Allgemeinen nicht empfohlen, Seiten dynamisch erstellt zu kratzen, aber ich verstehe nicht, warum einige Daten geschabt werden und einige nicht.
wie Daten Sieht Sie suchen ist in JSON-Objekt innerhalb dieses Tags "// Skript [@ id = 'matchStatsData']" und Auf Anfrage wird es in die Tabelle geladen. Es gibt natürlich Möglichkeiten, mit Regex zu spielen, aber es ist chaotisch. –
Kein Weg es zu tun (vielleicht mit Rselenium)? Ich bin bereit, Zeit zu verbringen – adaien