Ich habe Probleme bei der Kommunikation zwischen Selen und Scrapy-Objekt.Wie schreibe anpassen Downloader Middleware für Selen und Scrapy?
Ich benutze Selen, um mich auf einer Site anzumelden, sobald ich diese Antwort bekomme, möchte ich die Scrape-Funktionäre zum Parsen und Verarbeiten benutzen. Bitte helfen Sie mir, Middleware zu schreiben, so dass jede Anfrage Selen Web-Treiber durchlaufen sollte und die Antwort sollte an scrapy übergeben werden.
Vielen Dank!
Hallo Granitosaurus, danke für die Antwort. Ich würde gerne wissen, welche Änderungen ich an setting.py vornehmen muss und welchen Namen ich dieser Middleware geben soll und wo ich sie in meinem Projekt speichern soll. danke. – world
@world Sie können sehen, wie man eine benutzerdefinierte Middleware [hier] aktivieren kann (https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#activating-a-downloader-middleware) – Granitosaurus
Es ist unaufrichtig zu sagen Sie, es ist einfach, da Sie auf diese Weise viel mehr als nur Nebenläufigkeit brechen, da Sie den gesamten Downloader umgehen. Throttling, Cookies, Header, Proxy und mehr werden nicht richtig eingestellt und Selenium wird mit dem, was es standardmäßig ist, holen. Außerdem werden die Eigenschaften des Antwortobjekts nicht korrekt eingestellt, wie zum Beispiel 'status' und' headers'. – Rejected