Ich benutze Scrapy, um meine ganze Seite zu crawlen. Irgendwie sind die regulären Ausdrücke falsch.Scrapy gehen durch alle Links
Hier ist mein Teil:
def parse_items(self, response):
hxs = HtmlXPathSelector(response)
titles = hxs.xpath('//li')
items = []
for titles in titles:
item = CraigslistSampleItem()
item["title"] = titles.xpath("a/text()").extract()
item["link"] = titles.xpath("a/@href").extract()
items.append(item)
return(items)
Ich möchte alle Links in <li>
analysieren, erhalten die URL und den Anker-Tag.
Ich sehe keine regulären Ausdrücke in Ihrem Code – HyderA