2017-09-27 5 views
-1

Ich kratze SuperLawyers.com für Name und Adresse Informationen von Rechtsanwälten. Es scrapping alle richtigen Daten außer der Telefonnummer. Die Profilseiten haben die Telefonnummer zweimal, natürlich bin ich glücklich mit dem Extrahieren von beiden. Ein Beispiel für eine Seite:xPath für bestimmtes Element

https://profiles.superlawyers.com/massachusetts/somerville/lawyer/wyckoff-nissenbaum/e854f9a4-28d2-46e6-bf69-dee74c7ffdb1.html

Mein xPath: phone = response.xpath('//div[@id="lawyer_phone_button"]//text()').extract()

Antwort

1

Sie sollen nicht den a-Tag in diesem Fall überspringen. Verwenden Sie unter

phone = response.xpath('//div[@id="lawyer_phone_button"]/a/text()').extract() 

Arbeiten auf der Seite, die Sie

geschrieben