Ich verwende ein Python-Skript, um Informationen aus einer Website mithilfe der Selenium-Bibliothek zu extrahieren. einige Selektor, bekam ich ein WebElement Objekt des Elements Ziel ich nach dem ich so etwas wie folgt aussieht:Auswählen des übergeordneten Elementtextes nur mit Selenium
Die Id umgeben von:
<myTargetElement><strong>324. </strong>Some interesting content that might contain numbers 323 or dots ...,;</myTargetElement>
ich zwei Informationen in separaten extrahieren möchten die strong
Tag, und ich habe dies wie folgt geschehen:
myTargetElementObject.find_element_by_tag_name('strong').text.strip(' .')
Jetzt bin ich verwirrt, wie der andere Teil zu extrahieren. Wenn ich myTargetElementObject.text
benutze, wird es die ID innerhalb des Textes zurückgeben.
Die Daten, die ich extrahiere, sind sehr groß und ich bin vorsichtig bei der Verwendung von Regex. Gibt es eine Möglichkeit, mit WebElement-Objekt den Text des Elements ohne die Unterelemente zurückzugeben?
Sofern nicht Daten auf die Festplatte gepuffert werden, gehe ich davon aus, dass Selenium bereits Ihre Daten analysiert hat und sich in einem Objekt im RAM befindet. –