Ich habe diesen HTML Code (Website ist www.kupindo.com
):BeautifulSoup ohne Klasse zu finden
<div class="holder_content" style="margin-top:20px">
<div class="holder_pagination">
<a class="next_prev_link" href="/Knjige/Strucna-literatura/Biznis-i-organizacija/artikli/61_strana_2">« Prethodna</a>
<a href="/Knjige/Strucna-literatura/Biznis-i-organizacija/artikli/61">1</a>
<span style="float:left">...</span>
<a class="pagination_active_page">3</a>
<span style="float:left">...</span>
<a href="/Knjige/Strucna-literatura/Biznis-i-organizacija/artikli/61_strana_313">313</a>
<a class="next_prev_link" href="/Knjige/Strucna-literatura/Biznis-i-organizacija/artikli/61_strana_4">Sledeća »</a>
<form action="/Knjige/Strucna-literatura/Biznis-i-organizacija/artikli/61" name="formPagination" id="formPagination" method="post" style="width:170px">
<label>Idi na stranu:</label>
<input name="iStr" id="iStr" class="textbox" type="text">
<input name="butIdiNaStranu" id="butIdiNaStranu" value="Idi" type="submit">
</form>
</div>
</div>
Und ich brauche letzte Seitennummer (313) zu extrahieren, um durch alle Seiten zu durchlaufen. Wie kann ich das tun, wenn ich keine Klasse habe? Ich war nur in der Lage Nummer für die erste Seite zu extrahieren, mit:
broj=corba.find_all("div",{"class":"holder_pagination"})
und dann mit:
broj.find("a").text
und wenn ich len(broj)
tun, erhalte ich 1 (weil es nur eine holder_pagination, ich weiß das).