Mit dem BeautifulSoup-Modul in Python versuche ich, diese Webseite unten zu analysieren.Analysieren eines Div mit einem "Klassen" -Attribut
<div class="span-body"><div class="timestamp updated" title="2016-05-08T1231Z">May 8, 12:31 PM EDT</div></div>
Ich versuche, das Skript unten zu bekommen 2016-05-08T1231Z
zurückzukehren, die in der zweiten div mit der timestamp updated
Klasse zu finden ist.
with open("index.html", 'rb') as source_file:
soup = BeautifulSoup(source_file.read()) # Read the source file and get BeautifulSoup to work with it.
div_1 = soup.find("div", {"class": "span-body"}).contents[0] # Parse the first div.
div_2 = div_1("div", {"class": "timestamp updated"}) # Parse the second div.
print div_2
div_1
gibt, was ich (das zweite div) zurückkehren wollte, aber div_2
ist nicht, sondern nur es ist mir eine leere Liste im Gegenzug zu geben.
Wie kann ich dieses Problem beheben?
Ich reinigte es bis jetzt mit Ihrer Methode nur, um direkt zu 'div_2' und es funktioniert besser, aber von dort aus versuchte ich zu nehmen, dass und Rücksendung der Inhalt des' title' Attribut zu fragen. Wie mache ich das von hier aus? – Larsenv
Sie können es einfach indizieren. 'print (div_2 ['title'])' – Pythonista
['finden'] (https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find) gibt keine Liste zurück, es ist dasselbe wie Aufruf 'find_all (limit = 1)' – bmcculley