i Verschrottung machen versuchen StatistikenScrapy nicht zurückgehen mit XPath
in dieser URL zu bekommenhttp://www.acb.com/redaccion.php?id=133495
ich zunächst mit Spielernamen versuchen:
Import scrapy Importanforderungen von scrapy.item Import Artikel, Feld von ligafemanager.items importieren LigafemanagerItem
class Lf1Spider(scrapy.Spider):
name = 'lf1'
allowed_domains = ['acb.com']
start_urls = ['http://www.acb.com/redaccion.php?id=133495']
def parse(self, response):
self.logger.info('A response from %s just arrived!', response.url)
i = LigafemanagerItem()
i['acb_player_name'] = response.xpath('//td/div/codigo/table[1]/tbody/tr/td[2]/font/text()').extract()
self.logger.info('------------ACB NAME is: %s ------',
i['acb_player_name'])
return i
Ergebnisse nie zurückgeben
Erstens Dank für Ihre Hilfe, eine Frage, wenn ich schreiben // td/div/codigo/table/tr/td [2]/font/text() '). extract() Nicht alle Namen, nur die erste TR ¿Lösung? –
Nun, das sollte "// td/div/Codigo // Tabelle/tr/td [2]/font/text()" Sie müssen "//" für die Zuordnung eines untergeordneten Knotens verwenden. Anstelle von '/ table' verwenden Sie' // table' –