2017-11-24 3 views
1

Nehmen wir an, ich möchte den Text in allen hrefs in einer Seite analysieren, aber mein Code scheint nicht zu funktionieren. Es gibt einige Codeschnipsel in dem HTML-Dokument, das ich analysieren möchte.Schöne Suppe 'href' parse

<td class="alt1" id="ID" title="SOMETEXT"> 
       <div> 
        <a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a> 
       </div> 
</td> 

Dies ist der Code, ich versuche

from bs4 import BeautifulSoup, 
    for td in parse.find_all(class_="alt1"): 
     a = str(div.get()) 
     f.writelines(a + '\n') 
+0

'[tag.text für Tag in soup.find_all (href = True)]' zu laufen? –

Antwort

0

Verwenden find_all(href=True)

for td in parse.find_all(class_="alt1"): 
    for href in td.find_all(href=True): 
     print(href.text)