2017-03-16 2 views

Antwort

2

Sie re Modul verwenden können und ein RegexMuster passieren das Attribut übereinstimmen, z.B. rss am Ende der Zeichenfolge übereinstimmen, können Sie rss$ verwenden:

soup = BeautifulSoup("""<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a> 
<a href="http://trailers.apple.com/trailers/home/rss/newtrailers"></a>""", "html.parser") 

import re 
soup.find_all("a", {"href": re.compile("rss$")}) 
# [<a href="http://trailers.apple.com/trailers/home/rss/newtrailers.rss"></a>] 
0

Sie könnten Schleife durch alle a Tags, die Sie auf einer Seite finden und prüfen, ob ihre href Feld endet in .rss

for link in page.findAll(`a`): 
    if link['href'].endswith('.rss'): 
     **do something**