Ich versuche, die TitelRvest: warum die folgende XPath gibt leere Liste
ich die folgenden Codes verwenden mit rvest
aus faulen Tomaten zu extrahieren:
urlhtml<-read_html("http://www.rottentomatoes.com/browse/opening/")
df<-html_text(html_nodes(urlhtml,xpath="//*[@id='movies-collection']/div/div/div[2]/a"))
die xpath
von Google Chrome abgeleitet ist so Ich glaube, es ist richtig, aber es gibt leere Liste zurück ... Ich kann nicht herausfinden, was falsch ist.
Konnte jemand helfen? Sehr geschätzt
Sind Sie sicher, dass die Elemente gibt es in dem Dokument, das Sie holen oder Könnten sie später dynamisch per Javascript hinzugefügt werden? –
Ich bin kein Experte in Web-Programmierung, aber ich habe die Elemente in der HTML-Inspektion sehen, so glaube ich, dass sie nicht Javascript – Aiji
@ RogerLindsjö verwenden, gibt es trotzdem kann ich den Fall überprüfen, wenn es dynamisch von Javascript hinzugefügt wird? Und wenn das der Fall ist, was kann ich tun, um die Daten zu kratzen? Könnten Sie bitte Ihr Wissen teilen? – Aiji