2017-09-28 11 views
0

Scrapy scheint abgeschlossen zu sein, ohne alle Anfragen zu verarbeiten. Ich weiß das, weil ich vor und nach dem Anstehen der Anfrage logge, und ich kann das klar sehen.Anforderungen verschwinden nach der Warteschlange in scrapy

Ich melde mich beide Parsen und Fehler Callback-Methoden und keiner von ihnen wurde für diese fehlenden Anforderungen aufgerufen.

Wie kann ich debuggen, was mit diesen Anfragen passiert ist?

+0

Haben Sie "dont_filter = True" hinzugefügt, wenn Sie die Anfrage erneut einreihen? –

+0

@TarunLalwani Bingo! Es funktionierte, aber ich bin mir nicht sicher, warum Scrapy es fallen lassen sollte, denn in den gesamten 50 URLs hatte diese URL kein Duplikat. – comiventor

Antwort

0

Sie müssen dont_filter=True hinzufügen, wenn Sie die Anfrage erneut einreihen. Obwohl die Anfrage möglicherweise nicht mit anderen Anfragen übereinstimmt, merkt sich Scrapy, welche Anfragen bereits gestellt wurden und es wird herausgefiltert, wenn Sie es erneut in die Warteschlange stellen. Es wird angenommen, dass es aus Versehen war.

Verwandte Themen