2017-02-01 4 views
0

Ich versuche, Informationen unter Div-Klasse zu extrahieren, aber wenn ich den Code verwenden, erscheint die Nachricht "div" nicht definiert. Die Suppe funktioniert gut, und ich sehe, dass es viele divs in der Seite gibt, was könnte das Problem sein?mit beautifulsoup zu scrape HTML-Fehler "div" nicht definiert

soup = BeautifulSoup(html, "html.parser") 
for item in soup.find_all("div", attrs={"class" : "article-content"}): 
     print(div.find("a")['href']) 

Antwort

2

Die div Variable tatsächlich wurde nie definiert, gemeint Sie item stattdessen verwenden:

for item in soup.find_all("div", attrs={"class" : "article-content"}): 
    print(item.find("a")['href']) # or item.a['href'] 

Oder Sie direkt mit einem CSS selector zu den Links bekommen:

for a in soup.select("div.article-content a"): 
    print(a['href']) 
+0

Dank! Ich habe es tatsächlich nach ein paar Minuten gesehen, ja jetzt verstehe ich, dass es div not item sein sollte – song0089

Verwandte Themen