Ich bin neu in Python und kratzig, aber war ich versuche, einen Crawler und Schaber zu entwickeln Liste der Produkte auf einer Amazon-Seite zu extrahieren,Scrapy Crawler Excel-Ausgabe
die geschabt info Namen haben muß, Preis und beste Verfügbarkeit . Items werden gekratzt, jedoch wird jedes Objekt, das gekratzt wird, wenn es in einer CSV-Datei ausgegeben wird, vollständig in einer einzigen Zelle gespeichert.
Alles, was ich will, ist jedes Produkt und seine entsprechenden Angaben zu machen deutlich in jeder Zelle ausgegeben werden.
Die Logik ist:
items= []
for products in response.xpath('//*[@id="mainResults"]/ul'):
item = amazonlist()
item['Title'] = products.css('a>h2::text').extract()
item['Price'] = products.css(' div > div > div > a > span.a-size-base.a-color-price.s-price.a-text-bold::text').extract()
item['Prime'] = products.css(' div > div > div > i::attr(aria-label)').extract()
items.append(item)
return items
Können Sie mir mit diesem Handbuch?
Aber das würde immer noch menschliches Eingreifen erfordern, alles, was ich will, ist direkt die Inhalte auszugeben, die im Excel-Blatt organisiert sind. –