Mit der Art, wie ich hier Code geschrieben habe ich Ergebnisse von verschiedenen Seiten, aber aus irgendeinem Grund wirft diese Website einen Fehler. Da ich ein neuer Coder im Bereich Scrapy bin, habe ich nicht die Möglichkeit, das Problem selbst zu lösen. Xpaths sind in Ordnung. Ich füge, was ich im Terminal zu sehen zusammen mit dem Code:Scrapy Throws Attribut Fehler
items.py
import scrapy
class OlxItem(scrapy.Item):
Title = scrapy.Field()
Url = scrapy.Field()
olxsp.py
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor
class OlxspSpider(CrawlSpider):
name = "olxsp"
allowed_domains = ['olx.com.pk']
start_urls = ['https://www.olx.com.pk/']
rules = [Rule(LinkExtractor(restrict_xpaths='//div[@class="lheight16 rel homeIconHeight"]')),
Rule(LinkExtractor(restrict_xpaths='//li[@class="fleft tcenter"]'),
callback='parse_items', follow=True)]
def parse_items(self, response):
page=response.xpath('//h3[@class="large lheight20 margintop10"]')
for post in page:
AA=post.xpath('.//a[@class="marginright5 link linkWithHash detailsLink"]/span/text()').extract()
CC=post.xpath('.//a[@class="marginright5 link linkWithHash detailsLink"]/@href').extract()
yield {'Title':AA,'Url':CC}
settings.py
BOT_NAME = 'olx'
SPIDER_MODULES = ['olx.spiders']
NEWSPIDER_MODULE = 'olx.spiders'
ROBOTSTXT_OBEY = True
Bild des Terminals nach dem Scrapy fertig ausgeführt:
Könnten Sie auch Ihre Scrapy-Projekteinstellungen posten? Stellen Sie außerdem sicher, dass die von Ihnen geposteten Rückverfolgungen und Fehler Texte sind und keine Screenshots (die nicht durchsucht werden können). Vielen Dank. – alecxe
Danke Sir Alecxe, für Ihre freundliche Antwort. Ich habe nichts in settings.py gemacht, sondern so gehalten wie es ist. Wie auch immer, fügen Sie das auch in der Beschreibung hinzu. – SIM