Ich habe versucht, & lesen ein wenig HTML, um eine Liste der Bedingungen für Tiere in einem Tierheim zu erhalten. Ich bin mir sicher, dass meine Unerfahrenheit beim HTML-Parsen nicht hilft, aber ich glaube, dass ich nirgendwohin komme.R Lesen & Analysieren von HTML zur Liste
Hier ist ein Ausschnitt aus dem HTML:
<select multiple="true" name="asilomarCondition" id="asilomarCondition">
<option value="101">
Behavior- Aggression, Confrontational-Toward People (mild)
-
TM</option>
....
</select>
Es gibt nur einen Tag mit <select...>
und der Rest sind alle <option value=x>
.
Ich habe die XML-Bibliothek verwendet. Ich kann die Zeilenumbrüche und Tabs entfernen, haben aber keinen Erfolg Entfernen der Tags hatte:
conditions.html <- paste(readLines("Data/evalconditions.txt"), collapse="\n")
conditions.text <- gsub('[\t\n]',"",conditions.html)
Als Endergebnis würde ich eine Liste aller von den Bedingungen, dass ich weiter für die spätere Verwendung verarbeiten kann als Faktor Name:
Behavior- Aggression, Confrontational-Toward People (mild)-TM
Behavior- Aggression, Confrontational-Toward People (moderate/severe)-UU
...
ich bin nicht sicher, ob ich die XML-Bibliothek (oder eine andere Bibliothek) oder wenn gsub
Muster ausreichend seien verwenden müssen (oder so, muß ich herausfinden, wie es zu benutzen) .
Können Sie auf die vollständige URL mit diesem Auswahlfeld zeigen oder das Snippet etwas erweitern? – hrbrmstr
Ich finde das rvest Paket einfacher zu bedienen. Wenn Sie einen Link zu der Website bereitstellen können, könnte jemand eine Lösung von Ihnen codieren. – Dave2e
ist es HTML. es ist eine Auswahlliste in einer Form @alistaire – hrbrmstr