Ich versuche, diese Site zu scrappen, bekomme aber 'NotSupported: Nicht unterstütztes URL-Schema' ': Kein für dieses Schema verfügbarer Handler' dieser Fehler. Wenn die Regel nicht falsch ist, warum sie auftritt und was Ihr Vorschlag ist, bitte hilf mir. Danke vielmals.NotSupported: Nicht unterstütztes URL-Schema '': Kein Handler für dieses Schema verfügbar
Code ist hier:
from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor
class FellowSearch(CrawlSpider):
name ='fellow'
allowed_domains = ['emma.cam.ac.uk']
start_urls = [' https://www.emma.cam.ac.uk/']
rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)
def parse_obj(self, response):
print response.url
Ich sehe ein Leerzeichen vor 'Https'? –