2017-11-20 19 views
0

Ich lerne scrapy und habe eine harte Zeit versucht, dieses Problem zu lösen. Meine Spinne wird die macys Website nicht kriechen und hält werfen den folgenden Fehler:Scrapy Twisted ConnectionLost Fehler

[<twisted.python.failure.Failure twisted.internet.error.ConnectionLost: Connection to the other side was lost in a non-clean fashion: Connection lost.>] 

Dinge, die ich bisher ausprobiert habe:

  1. einstellen Kopf- und robotstxt pro diesen Thread zu gehorchen: Scrapy Shell: twisted.internet.error.ConnectionLost although USER_AGENT is set
  2. Ändern des Benutzeragenten für diesen Thread: How to prevent a twisted.internet.error.ConnectionLost error when using Scrapy?
  3. Kryptografie < 2 zu diesem Thema: Scrapy twisted connection lost in non-clean fashion. No proxy. Already tried headers
  4. Monkeypatch: Twisted Python Failure - Scrapy Issues

I scrapy shell "www.macys.com" in der Eingabeaufforderung auch überprüft, und die gleichen Fehler. Also ich vermute, das Problem ist nicht mit meiner Spinne. Könnte jemand bitte helfen?

+0

Können Sie sich noch auf die Website zugreifen in Ihr Navigator? –

Antwort

0

Es scheint, dass Ihre IP von Ihnen starten Ihren Scraper wurde auf die schwarze Liste gesetzt.

Sie könnten die folgenden lesen möchten: https://doc.scrapy.org/en/latest/topics/practices.html#avoiding-getting-banned

Auch Sie könnten stimmen wollen the settings über die Anzahl der Anfragen von scrapy ausgegeben: CONCURRENT_REQUESTS, DOWNLOAD_DELAY usw.

+0

Ich habe mein USER_AGENT auskommentiert und das Skript funktioniert. Irgendeine Idee warum das ist? USER_AGENT = 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, wie Gecko) Chrome/37.0.2049.0 Safari/537.36' – user6055239