Wie wird eine Scrapy-Klasse ausgeführt und wie fügt man einer Spider-Klasse zusätzliche Methoden hinzu?Definieren zusätzlicher Methoden in einer Scrapy-Klasse
Zum Beispiel aus der Dokumentation:
import scrapy
class DmozSpider(scrapy.Spider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
start_urls = [
"http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
"http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
]
def parse(self, response):
filename = response.url.split("/")[-2] + '.html'
with open(filename, 'wb') as f:
f.write(response.body)
Wenn ich ein paar Methoden für die Abfrage einer Datenbank oder etwas anderes definieren wollte, wie könnte ich darüber gehen, und warum?
Könnten Sie bitte erarbeiten, was wollen Sie für die Datenbank abzufragen? Vielen Dank. – alecxe
URLs zu crawlen, zum Beispiel – Adders