Ich bemerkte, dass ich manchmal während des Scraping blockiert, weil ein Session-Cookie auf zu vielen Seiten verwendet wurde. Gibt es eine Möglichkeit, alle Cookies beim Crawlen einfach zu löschen, um zum ursprünglichen Zustand des Crawlers zurückzukehren?Löschen Sie Cookies auf Scrapy vollständig, anstatt sie zu ändern
Antwort
Mit Blick auf die ähnliche Situation selbst. Ich kann hier leicht wegkommen, aber eine Idee, die ich habe, ist, CookieMiddleware abzuleiten und dann eine Methode zu schreiben, um die jar-Variable direkt zu optimieren. Es ist schmutzig, aber vielleicht ist es eine Überlegung wert.
Eine andere Option wäre, eine Feature-Anfrage zu schreiben, um mindestens eine Funktion zum Löschen der Cookies zu haben. Es kann leicht ein weiteres Jahr dauern, um es zu implementieren, wenn es überhaupt benötigt wird, ich vertraue Scrapy-Entwicklern hier nicht besonders.
Gerade ist mir aufgefallen, dass Sie Ihre eigenen cookiejar Meta verwenden können, und wenn Sie in den sauberen Zustand zurückkehren möchten, verwenden Sie einfach anderen Wert (etwas wie Inkrementierung einer Ganzzahl würde tun).
- 1. Komponente löschen, anstatt sie zu aktualisieren
- 2. So löschen Sie Cookies auf Seitenaktualisierung
- 3. Alamofire löschen Sie alle Cookies
- 4. Ändern Sie Funktionen in Python, anstatt sie neu zu definieren?
- 5. Cookies auf Seitenaktualisierung löschen
- 6. Winkelmesser: Browserdaten vollständig löschen
- 7. Android Webview - Löschen Sie den Cache vollständig
- 8. Löschen Sie Cookies in yii2 nach Funktionsaufruf
- 9. Löschen Sie Cookies in WebBrowser ohne Neustart
- 10. So löschen Sie Cookies in loadrunner 12.50
- 11. Wie Sie Datensätze ausblenden, anstatt sie zu löschen (Soft Delete von Grund auf neu)
- 12. So löschen Sie Cookies in angular.js
- 13. So löschen Sie Cookies von .Net
- 14. EF 4.3 Migration Umbenennung Spalte anstatt sie zu löschen
- 15. So senden Sie JavaScript und Cookies in Scrapy aktiviert?
- 16. So können Sie die Seitenquelle vollständig herunterladen, anstatt sie teilweise herunterzuladen?
- 17. Ändern Sie die Schriftgröße vollständig auf Text in der Schaltfläche?
- 18. Cookies auf Session_End löschen C#
- 19. Scrapy Authentifizierung Login mit Cookies
- 20. So löschen Sie ein Konto "Recurly" vollständig aus ruby api
- 21. Vollständig löschen genymotion Emulatoren
- 22. Zip mit Standardwert anstatt Werte zu löschen?
- 23. asp.net, Löschen eines Cookies
- 24. SKSpriteNode-Variable vollständig löschen
- 25. UIWebView Alle Cookies löschen
- 26. Können Sie Golong-Pakete für Schreibvorgänge löschen anstatt sie zu blockieren?
- 27. Verwenden von svn remove - Datei auf der Festplatte beibehalten, anstatt sie zu löschen?
- 28. wie man Cookies in scrapy überschreibt/verwendet
- 29. Scrapy - Sollte ich Cookies beim Crawlen aktivieren
- 30. Löschen Sie alle Cookies mit firefox webextension api
Mögliche Duplikate von [So löschen Sie Cookies in scrapy?] (Http://stackoverflow.com/questions/21924220/how-to-clear-cookies-in-scrapy) –
Vielen Dank! Ich habe diesen Thread gesehen, aber er erklärt, wie man neue Cookies einstellt und nicht, wie man sie bei bereits erbrachten Anfragen löscht. –
Haben Sie die zweite Antwort gelesen? http://StackOverflow.com/a/21930089/1534704 –