Im beautifulsoup4 eine Webseite zu analysieren, mit und sammeln Sie alle href Werte mit diesem CodeWie zu lösen, finden zwei von jeder Verbindung (BeautifulSoup, Python)
#Collect links from 'new' page
pageRequest = requests.get('http://www.supremenewyork.com/shop/all/shirts')
soup = BeautifulSoup(pageRequest.content, "html.parser")
links = soup.select("div.turbolink_scroller a")
allProductInfo = soup.find_all("a", class_="name-link")
print allProductInfo
linksList1 = []
for href in allProductInfo:
linksList1.append(href.get('href'))
print(linksList1)
linksList1 druckt zwei von jeder Verbindung. Ich glaube, dass dies geschieht, da es den Link sowohl vom Titel als auch von der Artikelfarbe her annimmt. Ich habe ein paar Dinge ausprobiert, aber ich kann BS nicht dazu bringen, nur den Titellink zu analysieren und eine Liste von jedem Link statt zwei zu haben. Ich stelle mir vor, es ist etwas wirklich einfaches, aber ich vermisse es. Vielen Dank im Voraus
make linksList1 ein set() statt list() –
vielen Dank – Harvey