2016-04-15 6 views
-1

Ich versuche, die TitelRvest: warum die folgende XPath gibt leere Liste

ich die folgenden Codes verwenden mit rvest aus faulen Tomaten zu extrahieren:

urlhtml<-read_html("http://www.rottentomatoes.com/browse/opening/") 
df<-html_text(html_nodes(urlhtml,xpath="//*[@id='movies-collection']/div/div/div[2]/a")) 

die xpath von Google Chrome abgeleitet ist so Ich glaube, es ist richtig, aber es gibt leere Liste zurück ... Ich kann nicht herausfinden, was falsch ist.

Konnte jemand helfen? Sehr geschätzt

+0

Sind Sie sicher, dass die Elemente gibt es in dem Dokument, das Sie holen oder Könnten sie später dynamisch per Javascript hinzugefügt werden? –

+0

Ich bin kein Experte in Web-Programmierung, aber ich habe die Elemente in der HTML-Inspektion sehen, so glaube ich, dass sie nicht Javascript – Aiji

+0

@ RogerLindsjö verwenden, gibt es trotzdem kann ich den Fall überprüfen, wenn es dynamisch von Javascript hinzugefügt wird? Und wenn das der Fall ist, was kann ich tun, um die Daten zu kratzen? Könnten Sie bitte Ihr Wissen teilen? – Aiji

Antwort

0

Vielen Dank allen, es stellt sich heraus, wie @ RogerLindsjö sagte, ich brauche eine Javascript, um die html zuerst zu analysieren und PhantomJS verwenden R zusammenzuarbeiten Verschrottung

Verwandte Themen