Einfach ausprobieren scrapy und versuchen, eine grundlegende Spinne zu arbeiten. Ich weiß, das ist wahrscheinlich etwas, das ich vermisse, aber ich habe alles versucht, was mir einfällt.Scrapy HtmlXPathSelector
Der Fehler, den ich bekommen ist:
line 11, in JustASpider
sites = hxs.select('//title/text()')
NameError: name 'hxs' is not defined
Mein Code ist im Moment sehr einfach, aber ich kann immer noch nicht zu finden scheinen, wo ich falsch gehe. Danke für jede Hilfe!
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
class JustASpider(BaseSpider):
name = "google.com"
start_urls = ["http://www.google.com/search?hl=en&q=search"]
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select('//title/text()')
for site in sites:
print site.extract()
SPIDER = JustASpider()
Wie laufen Sie Ihre Spinne? 'scrapy crawl" google.com "'? – Leo
Es ist nichts falsch mit Ihrem Code (abgesehen davon, dass Sie SPIDER nicht mehr deklarieren müssen), es funktioniert für mich. –
@Leo So habe ich es ausgeführt. –