Angenommen ich habe eine HTML-Zeichenfolge wie folgt:Wie extrahiere ich den Text innerhalb eines Tags mit BeautifulSoup in Python?
<html>
<div id="d1">
Text 1
</div>
<div id="d2">
Text 2
<a href="http://my.url/">a url</a>
Text 2 continue
</div>
<div id="d3">
Text 3
</div>
</html>
ich den Inhalt d2
extrahieren möchten, die NICHT von anderen Tags eingewickelt ist, das Überspringen a url
. Mit anderen Worten: Ich möchte ein solches Ergebnis erhalten:
Text 2
Text 2 continue
Gibt es eine Möglichkeit, es zu tun mit BeautifulSoup?
Ich versuchte dies, aber es ist nicht korrekt:
soup = BeautifulSoup(html_doc, 'html.parser')
s = soup.find(id='d2').text
print(s)