I HtmlCleaner2.1 Bibliothek bin mit für XPaths erzeugt durch XPather Plugin gegen html zu kratzen Inhalt daraus zu bewerten. Aber manchmal kann HtmlCleaner Xpath nicht auswerten.HtmlCleaner Fehler auf einigen XPaths erzeugt durch XPather
Für e.x. http://www.megaoutdoors.co.uk/norwegen-army-shirt-zipped-roll-top-collar-278-p.asp
Für Produkttitel, XPath von XPather gegeben ist // body/div [11]/div [6]/div [2]/form/div [1]/h1 Aber das scheitert, wenn ich es mit HtmlCleaner auswerte.
Wie können wir dieses Problem lösen? Ändert sich die Struktur der Seite, wenn htmlcleaner sie bereinigt?
Dank
Jitendra
@Jitendra: Im Allgemeinen ist keine gute Design-Wahl für ein Dokument, das behauptet, XHTML-Validierung sei ein schlechtes XML. –
Inwiefern schlägt es fehl? (Z. B. Fehlermeldung, erhält falsche Daten, bekommt keine Daten ...) – LarsH
@ Alejandro, Diese Websites sind nicht unsere, aber wir haben die Erlaubnis, sie zu kratzen. Also müssten wir sie auf jeden Fall abschaben. – RandomQuestion