Ich habe einen Scraper in Python geschrieben, um verschiedene Kategorienamen von einer Webseite zu bekommen, aber es kann nichts von dieser Seite holen. Ich bin ernsthaft verwirrt, um nicht herausfinden zu können, wo ich falsch liege. Jede Hilfe würde sehr geschätzt werden. HierIch kann Kategorietitel nicht von einer Webseite scratzen
ist der Link zu der Webseite: URL
Hier ist, was ich versucht habe, so weit:
from bs4 import BeautifulSoup
import requests
res = requests.get("replace_with_above_url",headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.text,"lxml")
for items in soup.select('.slide_container .h3.standardTitle'):
print(items.text)
Elements, in dem eine solche Kategorie Namen Ich bin nach:
<div class="slide_container">
<a href="/offers/furniture/" tabindex="0">
<picture style="float: left; width: 100%;"><img style="width:100%" src="/_m4/9/8/1513184943_4413.jpg" data-w="270"></picture>
<div class="floated-details inverted" style="height: 69px;">
<div class="h3 margin-top-sm margin-bottom-sm standardTitle">
Furniture Offers #This is the name I'm after
</div>
<p class="carouselDesc">
</p>
</div>
</a>
</div>
erhalten Sie die richtigen HTML in res.text? – imox
Es scheint, dass der Server nicht möchte, dass Sie die Daten scrappen :) Ihre Anfrage gibt Ihnen nicht die Seite zurück, die Sie tatsächlich in Ihrem Browser sehen, sondern eine Blockseite mit folgendem Inhalt "" Wie Sie www.therange.co durchsuchten. Irgendetwas an deinem Browser hat uns dazu gebracht, dich für einen Bot zu halten. Es gibt einige Gründe, warum das passieren könnte ... " – Andersson
Mit Selen versucht, aber das Endergebnis ist wie du @sir Andersson erwähnt hast. – SIM