2017-06-04 29 views
0

Ich habe eine Liste von URLs mit den gleichen Anker „Ansichtsseite“ unter anderen Art von Urls, wie folgt aus:einen Link von seinem Anker mit Python

<a href="url1" target="_blank">view page</a> 

<a href="url2" target="_blank">view page</a> 

Gibt es einen Weg, um alle zu extrahieren URLs mit diesem bestimmten Ankertext?

Danke

Antwort

0

Um Links mit Text Ansicht Seite Sie find_all('a', text='view page') verwenden können zu finden und dann die Schleife durch die Ergebnismenge und die URL daraus extrahieren:

from bs4 import BeautifulSoup  
soup = BeautifulSoup("""<a href="url1" target="_blank">view page</a> 
<a href="url2" target="_blank">view page</a> 
<a href="url2" target="_blank"></a>""", "html.parser") 

[a['href'] for a in soup.find_all('a', text='view page')] 
# [u'url1', u'url2'] 
+0

Danke Kumpel! – uskap

Verwandte Themen