Ich benutze Reddit als Basis für das Lernen von Scrappy. Es funktionierte für eine Weile gut, aber jetzt gibt es immer eine 301 Weiterleitung, selbst wenn man die Shell einfach mit "scrapy shell www.reddit.com" aufruft. Irgendwelche Ideen, wie das zu beheben ist?Scrapy Returning 301 für reddit.com
-1
A
Antwort
0
verwenden Sie das https/http-Schema in der URL
scrapy shell https://www.reddit.com
0
Ich denke, es ist etwas im Zusammenhang selbst reddit, wie es Ihre IP oder User-Agent scheint zu blockieren, müssen Sie versuchen, zwicken die folgenden: 1- Raise die DOWNLOAD_DELAY in scrapy Einstellungen 2- Versuchen Sie, Ihren User-Agent 3- Proxy verwenden mit scrapy
Für weitere Informationen über die Einstellungen zu ändern: http://doc.scrapy.org/en/latest/topics/settings.html
Für Scrapy-Proxy: http://doc.scrapy.org/en/latest/topics/downloader-middleware.html
Verwandte Themen
- 1. Scrapy - 301 Redirect in der Shell
- 2. Scrapy Shell bekommt 301 URL umgeleitet, ohne Parameter
- 3. casperjs kann nicht auf reddit.com klicken
- 4. wenig XPath für scrapy
- 5. Paketabhängigkeiten für Scrapy installieren
- 6. Einrichten von sendgrid für rails..returning Autorisierungsfehler
- 7. 301 Redirects für tote Links
- 8. Angular2: Returning Promise
- 9. strptime returning NA
- 10. jquery nodename returning undefined
- 11. Returning null T
- 12. WMIC Returning Odd Seriennummer
- 13. PHP + Shell Returning HTML
- 14. Scrapy wie Werkzeug für Nodejs?
- 15. Proxy-IP für Scrapy-Framework
- 16. NSData baseEncodedString returning nil
- 17. Google Scripts Returning Undefined
- 18. NSURLCredential creation returning null
- 19. C++ Returning Pointer/Referenzen
- 20. Returning String von Jms
- 21. ResponseEntity returning java.lang.Object
- 22. Returning index vector
- 23. Returning Self in Swift
- 24. Scrapy Handle 301/302 Response Code sowie folgen Sie der Ziel-URL
- 25. Scrapy Shell und Scrapy Splash
- 26. Internet Explorer Returning falsche Stringlänge
- 27. Returning Array der größten Zahlen
- 28. Tausende von 301 Weiterleitungen schlecht für SEO?
- 29. mysql query returning different dates
- 30. returning lastInsertId() aus Datenbank Klasse
Ziemlich sicher, es würde Fehler ohne eine vorangehende http oder https –