2016-05-05 10 views
-1

für die Übergabe der Seitenumbruch einer Website mit Python, ich möchte die letzte Seite einer Website finden. i inspizieren das Element der Seite von firebugWie finde ich die letzte Nummer in Tags

<div class="pagination"> 
       <ul> 
        <li> 
           <a> 
            <img src="/images" class="pagination-l"> 
           </a> 
        </li> 
          <li style="float:left;"> 
           <a id="toPage" title="A" class="page-number actif" href="/d"> 
            1 
           </a> 
          </li> 
          <li style="float:left;"> 
           <a id="toPage_0" title="A2" class="p" href="/ew"> 
            2 
           </a> 
          </li> 
          <li style="float:left;"> 
           <a id="toPage_1" title="A3" class="p3" href="/t3"> 
            3 
           </a> 
          </li> 
          <li style="float:left;">...</li> 
          <li style="float:left;"> 
           <a id="toPage_2" title="t" class="p" href="t2"> 
            5 
           </a> 
          </li> 
        <li> 
          <a id="nextPage" title="next(2)" href="/test1"> 
           <img src="test.png" class="pagination-r"> 
          </a> 
        </li> 
       </ul> 
</div> 

Hier ist die Nummer, die ich will, ist

+0

Ein Wort: [** BeautifulSoup **] (https://www.crummy.com/software/BeautifulSoup/bs4/doc/) – Jan

+0

@jan ich weiß nicht die ID der letzten Seite – parik

Antwort

1

Verwenden Sie eine Kombination aus einem Parser und regex:

from bs4 import BeautifulSoup 
import re 

html = your_html_here 

soup = BeautifulSoup(html, "html5lib") 
links = soup.findAll('a', text=re.compile('^\s*\d+\s*$')) 
number = links[-1].string.strip() 
print number 
# 5 

See a demo on ideone.com

+1

Danke für die Antwort und Demo – parik

Verwandte Themen