Ich versuche, Daten von einer alten HTML-Seite zu bekommen.Scrapy1.1/Python3 String aus der Zeichenfolge entfernen
Python3 Debian Scrapy 1.1
ich sehe haben ein paar Beispiel dafür, was ich versuche, hier zu tun, aber aus einem Grund, verstehe ich nicht, dass ich nicht in der Lage bin mit meinen Ergebnissen zu reproduzieren :
die Info-I ist der Kontakt Name erhalten möchten hier (John Doe)
<p><strong>Contact: <a href="http://www.example.com/t/search-title-Proprietor.html" style="color:#259cd5">Proprietor</a> John Doe</strong></p>
ich in der Lage bin zurück mit Scrapy:
Contact: [u'Contact: ', u' John Doe']
Das einzige Problem ist, dass der „Kontakt:“ Teil in meiner CSV-Datei geschrieben wird ...
Contact: , John Doe
ich ein paar regex und spiele mit den Variablen versucht, aber ich habe immer zu ein weiteres Problem.
Dies ist, was ich verwende die Daten zu erhalten:
item['Contact'] = response.xpath('//*[@id="main-contain"]/div[2]/div/div[6]/p[10]/strong/text()').extract()
ich auch mit .replace versucht(), aber ich am Ende mit
[u'', u' John Doe']