Ich habe eine Liste dieser <TD>
s und bin mit einem Listenverständnis, um sie alle auf einmal zu bekommen. Suchen, um den Text "v 11/4" in beiden Fällen zu extrahieren, dh mit/ohne die Sup Muss in ein einzelnes Element (für diese Zeile) extrahiert werden.XPATH (wieder) optional Tag-Element extrahieren einzelne Zeichenfolge
ex 1
<td>
<b class="black">2</b>/6 <a href="/some/link"onclick=
"returnHtml.popup(this," title="whateveryoulike">(ABL TTTTTSSSSSS
11)</a>v 11/4</td>
ex 2
<td>
<b class="black">2</b>/6 <a href="/some/link"onclick=
"returnHtml.popup(this," title="whateveryoulike">(ABL TTTTTSSSSSS
11)</a>v<sup>1</sup> 11/4</td>
Irgendwelche Ideen?
Was tun Sie den XPath auszuführen, 'lxml', scrapy, Selen, etwas anderes? – har07
scrapy - Problem gelöst – codervince
einfach für Anon-Benutzer zu kommen und Beiträge zu markieren. Komm schon, zeig deine Gesichter. – codervince