Ich bekomme HTML in der XPath-Ausgabe! Wie bekomme ich nur Text?

Ich bekomme immer HTML sowie den Text, den ich in Xpath möchte ich laufen und kann nicht herausfinden, wie man es stoppt, da ich nur den Text will.Ich bekomme HTML in der XPath-Ausgabe! Wie bekomme ich nur Text?

XPath-

hxs.xpath('//h1[@class="body2"]').extract()

Die HTML

<div class="product-title cf"> 


      <h1 itemprop="name" class="body2"> 
       Cornish Ale Dozen - Case of 12 
      </h1> 


</div>

Irgendwelche Vorschläge geschätzt würde dank

Quelle

2016-05-05 j.white

Was ist 'hxs'? Welche Programmiersprache ist das? – har07

In Ordnung, von Ihrer Frage Geschichte scheint dies zu Python Scrapy-Bibliothek ... – har07

Reine XPath Anweisung Textknoten anstelle des übergeordneten Elements wie folgt wäre zu bekommen:

//h1[@class="body2"]/text()

Insbesondere die Verwendung des obigen XPath sollte wie erwartet funktionieren, vorausgesetzt, dass die zum Ausführen des XPath verwendete Bibliothek Scrapy ist.

Quelle

2016-05-05 09:37:56 har07

Danke, perfekte Antwort! Ich dachte, es wäre relativ einfach. –

Ich bekomme HTML in der XPath-Ausgabe! Wie bekomme ich nur Text?

Antwort

Verwandte Themen