Gibt es eine Möglichkeit, Leerzeichen zu allen Elementen hinzuzufügen, die Text enthalten? Für dieses Beispiel:Whitespace zu Textelementen hinzufügen
movie <- read_html("http://www.imdb.com/title/tt1490017/")
cast <- html_nodes(movie, "#titleCast span.itemprop")
cast %>% html_structure()
[[1]]
<span.itemprop [itemprop]>
{text}
[[2]]
<span.itemprop [itemprop]>
{text}
Ich würde eine nachfolgende Leerzeichen auf jedes Textelement hinzufügen möchten, bevorhtml_text()
verwenden. Ich habe einen anderen Anwendungsfall, wo ich html_text()
höher in der Dokumenthierarchie verwenden möchte. Das Ergebnis ist, dass mehrere Texte innerhalb eines Vektorelements kombiniert werden. Dies macht es unmöglich, Anfang und Ende der entsprechenden Teile abzuleiten.
, das perfekt funktioniert, vielen Dank! :) Könnten Sie kurz erklären, wie dieser Code-Chunk funktioniert? Ich bin nicht vertraut mit '' '' UseMethod() '' ''. – methodds
@methodds: Einfach die Funktion vereinfacht. Sehen Sie hier, wie der alte funktioniert: http://adv-r.had.co.nz/OO-essentials.html#s3 Ich erkannte, dass ich das für einen speziellen Anwendungsfall von mir codiert. Das obige sollte für die meisten Anwendungsfälle in Ordnung sein ... – Rentrop
Danke das ist noch besser in auch etwas das ich verstehe. – methodds