2012-08-30 5 views
5

Wenn ich dieseerhalten die Web-Seite Quelle mit dem gerenderten html von Javascript

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://test.net"); 

Ich bin in der Lage, das Beweglichkeits Pack zu verwenden, um die HTML zu scannen und die meisten der Tags bekommen, die ich brauche, aber seine die fehlende HTML, das vom Javascript wiedergegeben wird.

Meine Frage ist, wie bekomme ich die endgültige gerenderte Seite Quelle mit C#. Gibt es noch etwas mehr für den WebClient, um die fertige gerenderte Quelle zu erhalten, nachdem JavaScript ausgeführt wurde?

+0

Ich bezweifle, dass Sie dies allein mit C# tun können. – ceejayoz

Antwort

1

Das HTML Agility Pack allein reicht nicht aus, um zu tun, was Sie wollen, Sie benötigen auch eine Javascript-Engine. Um dies zu tun, können Sie etwas wie Geckofx ausprobieren, mit dem Sie einen voll funktionsfähigen Webbrowser in Ihre Anwendung einbetten können und Ihnen erlauben, nach dem Rendern der Seite programmatisch auf den Inhalt des Doms zuzugreifen.

http://code.google.com/p/geckofx/

+0

neuere Geckofx finden Sie hier: https://bitbucket.org/geckofx/geckofx-14.0/ – Tom

Verwandte Themen