2017-01-11 4 views
0

Ich schreibe ein Python-Skript mit schönen Suppe, wo ich ein öffnendes Tag aus einer Zeichenfolge mit etwas HTML-Code erhalten muss.Wie bekomme ich das öffnende und schließende Tag in einer schönen Suppe aus der HTML-Zeichenfolge?

Hier ist mein string:

string = <p>...</p> 

I <p> in einer Variablen bekommen genannt opening_tag und </p> in einer Variablen closing_tag genannt. Ich habe die Dokumentation durchsucht, aber scheint keine Lösung zu finden. Kann mir das jemand empfehlen?

+0

können Sie nur Tag-Namen wie "p" - 'element.name' erhalten – furas

Antwort

1

Es gibt keine direkte Möglichkeit, das Öffnen und Schließen Teile des Tags in BeautifulSoup zu bekommen, aber zumindest können Sie die name davon bekommen:

>>> from bs4 import BeautifulSoup 
>>> 
>>> html_content = """ 
... <body> 
...  <p>test</p> 
... </body> 
... """ 
>>> soup = BeautifulSoup(html_content, "lxml") 
>>> p = soup.p 
>>> print(p.name) 
p 

Mit html.parser wenn Sie auf „Start hören "und" Ende "Tag" Ereignisse ".

Verwandte Themen