2016-09-21 5 views
1

auf der Website, dass ich versuche, sind Tags wie zu analysieren:BeautifulSoup: Wie Inhalte extrahieren?

<a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a> 

Ich mag eine Liste von ihrem Inhalt bekommen würde (hier ist es 2.526.286 Wert). Wie kann ich das machen? Ich habe versucht mit

for node in soup.find_all('a', {'class': 'sku'}): 
print(node.content) 

aber es gibt "None" für jedes Tag gefunden.

+1

'node.text' oder' Knoten [ "title"] 'Verwenden –

Antwort

2

können Sie verwenden:

for node in soup.find_all('a', {'class': 'sku'}): 
    print(node.string) 

Wie ganzen Code:

from bs4 import BeautifulSoup 

string = """ 
<div> 
    <a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a> 
</div> 
""" 
soup = BeautifulSoup(string, "lxml") 
for node in soup.find_all('a', {'class': 'sku'}): 
    print(node.string) 
+0

perfekt funktioniert! Vielen Dank! – bLAZ

Verwandte Themen