Ich scrape Inhalt mit XPath. Was ich kratzen muss ist ein Inhalt in div
mit gegeben id
. Innerhalb dieser div
gibt es noch eine div
, deren Inhalt ich nicht kratzen möchte.XPath: Kindelement ausschließen
Ich verwende folgende XPath:
//[@id='Main'][not(contains(div/@id, 'orderform'))]
Aber mit dieser XPath i Extraktion erhalten nicht von allen Urls, wie ich erwarten würde, aber von diesen Urls, die div id="Main"
tun haben und haben nicht div id="orderform"
innen es.
Welche XPath sollte ich stattdessen verwenden, um die gesamte div id="Main"
zu kratzen, aber den Inhalt von div id="orderform"
ausschließen?
den HTML-Code –
@ 宏杰 李 bearbeitet Beitrag –