Folgendes: scrapy's Tutorial Ich machte einen einfachen Bild-Crawler (scrapes Bilder von Bugattis). Das wird unten in BEISPIEL veranschaulicht.Scrapy: Bilder Pipeline, Bilder herunterladen
Allerdings hat mich der Leitfaden mit einem nicht funktionierenden Crawler verlassen! Es findet alle URLs, aber es lädt die Bilder nicht herunter.
Ich fand eine Entenbandlösung: ersetzen ITEM_PIPELINES
und IMAGES_STORE
so, dass;
ITEM_PIPELINES['scrapy.pipeline.images.FilesPipeline'] = 1
und
IMAGES_STORE
->FILES_STORE
Aber ich weiß nicht, warum funktioniert das? Ich möchte die ImagePipeline wie von scrapy dokumentiert verwenden.
BEISPIEL
settings.py
BOT_NAME = 'imagespider'
SPIDER_MODULES = ['imagespider.spiders']
NEWSPIDER_MODULE = 'imagespider.spiders'
ITEM_PIPELINES = {
'scrapy.pipelines.images.ImagesPipeline': 1,
}
IMAGES_STORE = "/home/user/Desktop/imagespider/output"
items.py
import scrapy
class ImageItem(scrapy.Item):
file_urls = scrapy.Field()
files = scrapy.Field()
imagespider.py
Danke! Sie könnten auch 'ImageItem' ändern, um' image_urls' und 'imageItem (image_urls = [img_url])' 'zu erhalten –