Newbie für Python, würde die Verwendung lxml + XPath wie Video-Link von Webseite zu bekommen, was ich jetzt habe ist:Verwenden von Python Lxml + Xpath, um Videos von einer Seite zu erhalten, eine Liste, aber kann das Ergebnis nicht ausdrucken?
import urllib2
from lxml import etree
url=u"http://hkdramas.se/fashion-war-%E6%BD%AE%E6%B5%81%E6%95%99%E4%B8%BB-episode-20/"
xpath=u"//script[contains(.,'label:\"360p\"')]"
html=urllib2.urlopen(url).read()
selector=etree.HTML(html)
get=selector.xpath(xpath)
print get
Ich habe checken type()
von get
, die mir zeigt, es ist ein list
, aber wenn I print get
, zeigt es mir unerwartet [<Element script at 0x2a34b88>]
, was ist das? und wie kann ich die tatsächliche URL des Videos statt Element script
extrahieren?
schließlich bekam ich, warum ich dieses Problem hatte, dank @unutbu
xpath=u"//script[contains(.,'label:\"360p\"')]"
sollte
xpath=u"//script[contains(.,'label:\"360p\"')]//text()"
die text()
sicher Rückkehr nur Text machen hinzugefügt werden, aber keine Elemente, Beachten Sie unter dem Auswahlelement die //
, die kompatibel ist, wenn viele Unterelemente der Auswahl vorhanden sind.
Dank für die schnelle und ausführliche Antwort verwenden, obwohl ich nicht vertraut von 're' Modul bin, glaube ich, kann dafür später aufholen. Aber der Teil der Erklärung von Xpath ist sehr nützlich, danke. Ich werde meine Lösung auf OP setzen. – anyone