2016-05-05 12 views
1

Ich bekomme immer HTML sowie den Text, den ich in Xpath möchte ich laufen und kann nicht herausfinden, wie man es stoppt, da ich nur den Text will.Ich bekomme HTML in der XPath-Ausgabe! Wie bekomme ich nur Text?

XPath-

hxs.xpath('//h1[@class="body2"]').extract() 

Die HTML

<div class="product-title cf"> 


      <h1 itemprop="name" class="body2"> 
       Cornish Ale Dozen - Case of 12 
      </h1> 


</div> 

Irgendwelche Vorschläge geschätzt würde dank

+0

Was ist 'hxs'? Welche Programmiersprache ist das? – har07

+0

In Ordnung, von Ihrer Frage Geschichte scheint dies zu Python Scrapy-Bibliothek ... – har07

Antwort

1

Reine XPath Anweisung Textknoten anstelle des übergeordneten Elements wie folgt wäre zu bekommen:

//h1[@class="body2"]/text() 

Insbesondere die Verwendung des obigen XPath sollte wie erwartet funktionieren, vorausgesetzt, dass die zum Ausführen des XPath verwendete Bibliothek Scrapy ist.

+0

Danke, perfekte Antwort! Ich dachte, es wäre relativ einfach. –

Verwandte Themen