2017-08-17 3 views
0

Auf this Website möchte ich den Code "539300" in der oberen Suchfeld eingeben und erhalten Sie entweder die Ergebnisse (nur die new url) oder einige Inhalte (mit Xpath) von der Seite.Web Scraping in R durch das Posten von Javascript

library(rvest); library(httr); library(RCurl) 

url <- "http://www.moneycontrol.com" 


res <- POST(url, body = list(search_str = "539300"), encode = "form") 

pg <- read_html(content(res, as="text", encoding="UTF-8")) 

html_node(pg, xpath = '//*[@id="nChrtPrc"]/div[3]/h1') 

Dies führt zu einem Fehler

{xml_missing} 
<NA> 
+0

Konnten Sie einen Schnappschuss der Tabelle zur Verfügung stellen, die Sie versuchen zu kratzen? –

+0

Hallo, in der [neuen URL Link] (http://www.moneycontrol.com/india/stockpricequote/miscellent/akspintex/AKS01) <- ich will '// * [@ id = "nChrtPrc"]/div [ 3]/h1 '- Pfad, der "AK Spintex" ist. – Vasim

+1

_ "Die Vervielfältigung von Nachrichten, Fotos, Videos oder anderen Inhalten ganz oder teilweise in irgendeiner Form oder mit beliebigem Medium ohne ausdrückliche schriftliche Genehmigung von moneycontrol.com ist verboten." _ – hrbrmstr

Antwort

0

Oder nur RCurl und XML-Bibliotheken verwenden.

library(RCurl) 
library(XML) 

url <- "http://www.moneycontrol.com/india/stockpricequote/miscellaneous/akspintex/AKS01" 
curl <- getCurlHandle() 
html <- getURL(url,curl=curl, .opts = list(ssl.verifypeer = FALSE),followlocation=TRUE) 
doc <- htmlParse(html, encoding = "UTF-8") 
h1 <-xpathSApply(doc, "//*[@id='nChrtPrc']/div[3]/h1//text()") 
print(h1)