Schöne Suppe 'href' parse

Nehmen wir an, ich möchte den Text in allen hrefs in einer Seite analysieren, aber mein Code scheint nicht zu funktionieren. Es gibt einige Codeschnipsel in dem HTML-Dokument, das ich analysieren möchte.Schöne Suppe 'href' parse

<td class="alt1" id="ID" title="SOMETEXT"> 
       <div> 
        <a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a> 
       </div> 
</td>

Dies ist der Code, ich versuche

from bs4 import BeautifulSoup, 
    for td in parse.find_all(class_="alt1"): 
     a = str(div.get()) 
     f.writelines(a + '\n')

Quelle

2017-11-24 lebar.123

'[tag.text für Tag in soup.find_all (href = True)]' zu laufen? –

Verwenden find_all(href=True)

for td in parse.find_all(class_="alt1"): 
    for href in td.find_all(href=True): 
     print(href.text)

Quelle

2017-11-24 14:08:50

Schöne Suppe 'href' parse

Antwort

Verwandte Themen