7
Ich versuche, Bild in Via Scrapy herunterladen. Hier sind meine verschiedenen Dateien:Herunterladen von Bildern in scrapy
items.py
class DmozItem(Item):
title = Field()
image_urls = Field()
images = Field()
settings.py
BOT_NAME = 'tutorial'
SPIDER_MODULES = ['tutorial.spiders']
NEWSPIDER_MODULE = 'tutorial.spiders'
ITEM_PIPELINES = ['scrapy.contrib.pipeline.images.ImagesPipeline']
IMAGES= '/home/mayank/Desktop/sc/tutorial/tutorial'
Spinne
class DmozSpider(BaseSpider):
name = "wikipedia"
allowed_domains = ["wikipedia.org"]
start_urls = [
"http://en.wikipedia.org/wiki/Pune"
]
def parse(self, response):
hxs = HtmlXPathSelector(response)
items = []
images=hxs.select('//a[@class="image"]')
for image in images:
item = DmozItem()
link=image.select('@href').extract()[0]
link = 'http://en.wikipedia.com'+link
item['image_urls']=link
items.append(item)
Trotz all diese Einstellung ich meine Pipeline nicht bekommt aktiviert. Bitte helfen. Ich bin neu in diesem Rahmen.
Haben Sie PIL (Python Imaging Library) installiert? Dies ist eine Voraussetzung für das Herunterladen von Bildern: http://doc.scrapy.org/en/latest/topics/images.html – Talvalin
Woher wissen Sie, dass die Pipeline nicht aktiviert wird? Können Sie ein wenig Log-Ausgabe einfügen, etwa so: '2013-04-16 16: 40: 31-0500 [scrapy] DEBUG: Aktivierte Item-Pipelines: ImagesPipeline'. –