Angenommen, ich habe folgende html
:ausschließen Artikel von Web-Scraped Schleife
<h4>
<a href="http://www.google.com">Google</a>
</h4>
<h4>Random Text</h4>
Ich bin in der Lage, alle h4
Schriften über eine Schleife zu identifizieren, wie zum Beispiel:
for url in soup.findAll("h4")
print(url.get_text())
Und das funktioniert gut, außer Es enthält das Element "Random Text" der Überschrift h4
. Ist es möglich, Vorkommen von h4
Überschriften programmatisch zu entfernen, die bestimmte Kriterien nicht erfüllen, z. B. solche, die keine Verknüpfung enthalten?
Oder 'wenn url.a: print (url.get_text())' –