Ich bin dabei, einen (früher) funktionierenden Website Crawler zu aktualisieren. Es scheint, dass die Website, auf der ich gecrawlt bin, strengere Verbotsregeln eingeführt hat, weshalb ich begonnen habe, Crawlera als einen Versuch zu verwenden, dieses Problem zu umgehen.Crawlera Ban Regeln für Scrapy anpassen
Das Problem, das ich derzeit habe, ist, dass die Zielwebsite eine nicht standardmäßige banning-Methode verwendet, eine 302 zu einer Standard-HTML-Seite zu tun. Crawlera erkennt dies nicht als ein Verbot und stoppt sofort den Crawl. Kann ich irgendwie anpassen, was Crawlera als Verbot erkennt, oder muss ich einen anderen Ansatz prüfen?
Das ist völlig richtig, endete mit der Auflösung dieses über ein Support-Ticket und sie konnten diese Regel zu ihrem System hinzufügen. – Miek