Ich muss die Liste verweigern in Crawl-Regel beim Crawlen der Website aktualisieren. (Dh ich möchte dynamisch ändern Regeln Verweigerungsliste, während meine Spinne arbeitet)scrapy CrawlSpider: Ändern Sie die Liste der Regeln während des Crawlens
was habe ich versucht
deny = ['a','b','c']
rules = (Rule(LinkExtractor(allow=('/r/','/p/'), deny=deny), callback='parse_item', follow=True),)
ist und dann durchgeführt self.deny.append(unique_category)
in parse_item()
Funktion, aber es hat funktioniert nicht wie ich erwartet hatte: Verweigerungsliste aktualisiert wurde ignoriert (der Crawler ging immer wieder in die gleiche Kategorie).
Ich würde mich über Vorschläge freuen. Dank
erhalten Sie eine Fehlermeldung? stelle immer volle Fehlermeldung (Traceback) in Frage (als Text, nicht als Screenshot). Es gibt andere nützliche Informationen. – furas
Entschuldigung für mangelnde Erklärung, Furas. Ich habe gemeint, dass der Crawler die angehängten Regeln einfach ignoriert. –