Ich möchte die Tabelle aus HTML-Code mit beautifulsoup kratzen. Ein Ausschnitt des HTML ist unten gezeigt. Bei Verwendung von table.findAll('tr')
bekomme ich die gesamte Tabelle und nicht nur die Zeilen. (Wahrscheinlich, weil die schließenden Tags aus dem HTML-Code fehlen?)Python - beautifulsoup - wie man mit fehlenden schließenden Tags umgehen kann
<TABLE COLS=9 BORDER=0 CELLSPACING=3 CELLPADDING=0>
<TR><TD><B>Artikelbezeichnung</B>
<TD><B>Anbieter</B>
<TD><B>Menge</B>
<TD><B>Taxe-EK</B>
<TD><B>Taxe-VK</B>
<TD><B>Empf.-VK</B>
<TD><B>FB</B>
<TD><B>PZN</B>
<TD><B>Nachfolge</B>
<TR><TD>ACTIQ 200 Mikrogramm Lutschtabl.m.integr.Appl.
<TD>Orifarm
<TD ID=R> 30 St
<TD ID=R> 266,67
<TD ID=R> 336,98
<TD>
<TD>
<TD>12516714
<TD>
</TABLE>
Hier ist meine Python-Code zu zeigen, was mit denen ich zu kämpfen:
soup = BeautifulSoup(data, "html.parser")
table = soup.findAll("table")[0]
rows = table.find_all('tr')
for tr in rows:
print(tr.text)
Großartig, vielen Dank !!! Es ist perfekt! – Christian