Web Scraping in R durch das Posten von Javascript

Auf this Website möchte ich den Code "539300" in der oberen Suchfeld eingeben und erhalten Sie entweder die Ergebnisse (nur die new url) oder einige Inhalte (mit Xpath) von der Seite.Web Scraping in R durch das Posten von Javascript

library(rvest); library(httr); library(RCurl) 

url <- "http://www.moneycontrol.com" 


res <- POST(url, body = list(search_str = "539300"), encode = "form") 

pg <- read_html(content(res, as="text", encoding="UTF-8")) 

html_node(pg, xpath = '//*[@id="nChrtPrc"]/div[3]/h1')

Dies führt zu einem Fehler

{xml_missing} 
<NA>

Quelle

2017-08-17 Vasim

Konnten Sie einen Schnappschuss der Tabelle zur Verfügung stellen, die Sie versuchen zu kratzen? –

Hallo, in der [neuen URL Link] (http://www.moneycontrol.com/india/stockpricequote/miscellent/akspintex/AKS01) <- ich will '// * [@ id = "nChrtPrc"]/div [ 3]/h1 '- Pfad, der "AK Spintex" ist. – Vasim

_ "Die Vervielfältigung von Nachrichten, Fotos, Videos oder anderen Inhalten ganz oder teilweise in irgendeiner Form oder mit beliebigem Medium ohne ausdrückliche schriftliche Genehmigung von moneycontrol.com ist verboten." _ – hrbrmstr

Oder nur RCurl und XML-Bibliotheken verwenden.

library(RCurl) 
library(XML) 

url <- "http://www.moneycontrol.com/india/stockpricequote/miscellaneous/akspintex/AKS01" 
curl <- getCurlHandle() 
html <- getURL(url,curl=curl, .opts = list(ssl.verifypeer = FALSE),followlocation=TRUE) 
doc <- htmlParse(html, encoding = "UTF-8") 
h1 <-xpathSApply(doc, "//*[@id='nChrtPrc']/div[3]/h1//text()") 
print(h1)

Quelle

2017-08-17 12:00:10

Web Scraping in R durch das Posten von Javascript

Antwort

Verwandte Themen