2016-11-06 3 views
-2

Ich arbeite an R und ich möchte Daten aus dem Code einer Seite extrahieren und in einem Datenrahmen transformieren. Ich denke, dass das, was ich möchte diese in der Nähe tun (BeautifulSoup extract data within a div), aber wenn möglich, würde ich mag esR - Extrahieren von Daten innerhalb einer div

hier mit R. tun, ist der Code, der mich interessiert:

<div class="item clearfix" artist="Georges" song="Melody" ...> 
<div class="item clearfix" artist="Leonard" song="Inspiration" ...> 
<div class="item clearfix" artist="Bill" song="Gold" ...> 

ich möchte es haben, wie:

Data Frame

die meisten Beispiele, die ich versuchen, lesen sie den Text zwischen Text zu bekommen, aber mein Problem ist ein bisschen anders, und ich weiß wirklich nicht, wo ich anfangen soll.

+0

Werfen Sie einen Blick auf die RVP-Paket. Die Funktionen html_nodes und html_attr sollten genau das sein, wonach Sie suchen. – Dave2e

+0

Bitte geben Sie den Code für den Versuch an, den Sie bis jetzt gemacht haben. Da SO kein Code-Writing-Service ist, bitten wir Sie, ein minimales, vollständiges, überprüfbares Beispiel Ihres Codes und des Problems, auf das Sie gestoßen sind, anzugeben. –

+0

Sie haben keine URL angegeben, was bedeutet, dass Sie mit hoher Wahrscheinlichkeit versuchen, gegen die Nutzungsbedingungen einer Website zu verstoßen. Fügen Sie die URL ein und zeigen Sie einen von Ihnen getesteten R-Code an, der nicht funktioniert hat, oder ziehen Sie in Betracht, Ihre Frage zu löschen. Auch sind Bilder für Plots, nicht Daten oder Code. – hrbrmstr

Antwort

2

Vielen Dank für Ihre Hilfe. Ich hätte etwas Code gepostet wenn ich irgendwas aber wie gesagt hätte, ich wüsste nicht wo ich anfangen soll, das Paket/die Funktion zu benutzen.

Nach den Erkenntnissen von Dave2e konnte ich mein Problem lösen. Hier ist der Code:

info <- read_html(url) %>% html_nodes(xpath = '//*[@class="item clearfix"]') %>% xml_attr("artist") 
Verwandte Themen