i XPath bin mit einer Seite verschrotten, aber ich bin mit Mühe mit einem Teil des Codes:Python Xpath erhält den Wert nur vom Root-Elemente
<div class="description">
here's the page description
<span> some other text</span>
<span> another tag </span>
</div>
ich diesen Code bin mit zu erhält den Wert von Elemente:
description = tree.xpath('//div[@class="description"]/text()')
i die richtigen div ich suche nicht finden, aber ich will nur den Text bekommen „hier ist die Seitenbeschreibungs“ nicht der Inhalt von inneren span-Tags
Wer weiß, wie kann ich nur den Text in der Root-Knoten, aber nicht den Inhalt von Kindknoten?
dass Xpath-Ausdruck sollte nicht den Inhalt der Spannen enthalten, sondern nur den Inhalt der Textknoten, die direkte Kinder des div sind: '[" \ n Hier ist die Seitenbeschreibung \ n ", '\ n', '\ n']' – mata