Warum geben die folgenden zwei Code-Snippets unterschiedliche Ausgaben? Der einzige Unterschied zwischen ihnen besteht darin, dass das h1
-Tag im ersten Fall im zweiten Fall durch ein h
-Tag ersetzt wird. Ist das, weil das h1
Tag eine spezielle "Bedeutung" in HTML hat? Ich versuchte mit h1
durch h6
und alle von ihnen geben []
als Ausgabe, während mit h7
es anfängt, [u'xxx']
als Ausgang zu geben.Verhalten des Scrapy-Xpath-Selektors auf h1-h6-Tags
from scrapy import Selector # scrapy version: 1.2.2
text = '<h1><p>xxx</p></h1>'
print Selector(text=text).xpath('//h1/p/text()').extract()
Output[1]: []
text = '<h><p>xxx</p></h>'
print Selector(text=text).xpath('//h/p/text()').extract()
Output[2]: [u'xxx']
Vielen Dank für die Anzeige, dass Druck (s.extract()) erzählt, was unter der Haube ist! – FJDU