1

Ich muss dynamisch generierten HMTL-Code mit einem HTML Agility Pack analysieren.Wie dynamisch HTML-Code mit HTML Agility Pack analysieren?

Zum Beispiel dieser Code:

<div class="navigation_noClass"> There are 43 articles </div> 

nicht in der Seitenquelle Option des Web-Browsers angezeigt, dh, dieser Code ist nur sichtbar, mit einigen Tools untersuchen wie Firebug, Inspect Context ...

+0

Sie können den Code mit vier Leerzeichen am Anfang jeder Zeile formatieren – dldnh

Antwort

0

Im Moment scheint es so, als würde man den HTML-Code direkt in das Agility-Paket einspeisen und damit einige der (entscheidenden) Schritte verpassen, die ein normaler Browser tun würde. , d. H. Die Ausführung von Javascript und/oder CSS.

Es gibt zahlreiche Optionen zum Ausführen von Javascript, aber die meisten der "eigenständigen" Optionen erfordern, dass Sie das DOM und die zugehörige Funktionalität neu erstellen. Nicht trivial.

Und dann gibt es die Gelegenheiten, wo CSS Inhalt enthält (wie die Vorher/Nachher-Pseudoelemente). Soweit ich weiß, gibt es nicht viele Bibliotheken, um das CSS-Verhalten einer HTML-Quelle außerhalb eines Browsers zu simulieren.

All dies bedeutet, wenn Sie wirklich die Ausgabe von Javascript und/oder CSS-Ausführung erfassen müssen, kann es am einfachsten sein, einen Browser direkt in Ihre App-Verarbeitungspipeline zu verdrahten (wie eines der Chromium-basierten Angebote) und Abfrage seines DOM (ähnlich wie die vielen Web Testing Suites).

Hinweis: Wenn es sich um eine ernstzunehmende Serverstyling-Task handelt, sollten Sie diese Verarbeitung auf dedizierten Servern/App-Pools/Prozessen auslagern, um Ihrer App eine gute Chance zu gegebener Zeit und/oder Arbeitsspeicher zu geben.

Verwandte Themen