2017-02-21 1 views
2

Ich bin völlig neu in XPath Konzept und ich habe ein sehr grundlegendes Verständnis von XPath. Ich benutze XPath zum ersten Mal zum Auffinden von Web-Elementen auf der HTML-Seite.XPath wird hauptsächlich für HTML oder XML oder XHTML verwendet?

Jetzt während der Suche über das Web (Videos und Text), fand ich, dass alle XPath-Tutorials mit XML (und nicht HTML-Seiten) verwandt sind.

Wiki sagt,

XPath (XML Path Language) ist eine Abfragesprache für die Knoten aus einem XML-Dokument auswählen.

Das hat mich sehr verwirrt.

  1. Wird XPath nicht für HTML-Dokumente verwendet?
  2. Gibt es grundlegende/strukturelle Unterschiede beim Schreiben von XPath für HTML, XML, XHTML?

Bitte beachten Sie, dass ich verstehe, dass diese Frage unterdurchschnittlich ist, aber nur aus völliger Konfuson frage ich es hier.

+1

Siehe http://StackOverflow.com/Questions/17642286 –

+0

XPath 3.1 unterstützt JSON sowie – Alohci

Antwort

1

Sie haben ein Recht, verwirrt zu sein.

XPath arbeitet mit einem Datenmodell, das allgemein davon ausgeht, dass Markup well-formed ist. Per Definition sind XML und XHTML notwendigerweise wohlgeformt; HTML, nicht unbedingt. HTML-Parser können jedoch häufig nicht gut geformte Markups erfolgreich im Sinne einer Liberalität in dem, was man als Eingabe akzeptiert, in ein für XPath geeignetes Datenmodell parsen.

Daher können Sie in der Regel auch XPath mit HTML verwenden. Die Verwendung von XPath auf diese Weise ist tatsächlich eine übliche Web-Seiten-Scraping-Technik.

+0

seltsam !, gab es eine andere Antwort auf dieser Seite, aber diese Person entfernt seine/ihre Antwort. – dheer

Verwandte Themen