0
Wenn es ein base Tag in HTML gibt, werden die relativen Links unterschiedlich gerendert. Wir erwarteten Link Extractors class in scrapy, um es automatisch zu behandeln. Aber das scheint nicht zu geschehen.Scrapy Link Extractors unterstützt keine Basistag
Was wäre der Standard-Scrapy-Weg, um dieses Problem zu lösen?
Sie die 'tags' init Argument versucht haben, in der' LinkExtractor' Klasse? – Wilfredo
@ Wilfredo - Ich habe es versucht und es hat funktioniert. Scheint das Problem ist anders, es nimmt nur erste 4096 Zeichen in HTML, um nach Basis-Tag zu überprüfen. Und in unserem Fall ist es viel darunter? Irgendwelche Gedanken über das gleiche –
Found das Problem - https://github.com/scrapy/scrapy/issues/3017 –