2009-07-27 13 views
0

Ich bin auf der Suche nach einer http-Bibliothek (für C# -Programm), mit dem ich einige HTML-Dokumente aus dem Internet herunterladen kann. Ich kenne das HttpWebRequest-Objekt und die anderen Optionen, die von der .NET-Bibliothek bereitgestellt werden, benötige jedoch eine vollständigere Lösung, die verschiedene Dokumentcodierungen verarbeiten kann (manchmal wird die Codierung im Dokument selbst und nicht in der HTTP-Datei angegeben) Kopfzeilen).Komplette Http-Bibliothek

Danke.

Antwort

3

Die WCF Rest Starter Kit enthält eine HttpClient-Klasse, die ziemlich hilfreich ist - sie ist heute für .NET 3.5 SP1 verfügbar und kann sofort verwendet werden. Da es scheint, dass es als eine nützliche Klasse betrachtet wird, könnte es in der zukünftigen Version von .NET 4.0 in der Basisklassenbibliothek angezeigt werden.

Definitiv auch ein tutorial screencast von Aaron Skonnard Besuche mit der Httpclient und andere Leckereien aus der WCF-Starter-Kit ruhen und andere WCF-Starter-Kit Ressourcen ruhen:

http://msdn.microsoft.com/en-us/netframework/cc950529.aspx

Marc

+0

Downvoted für .NET 4.0 noch nicht einmal RTM, so dass der Fragesteller es möglicherweise für einige Monate nicht in der Produktionsumgebung verwenden kann. –

+0

Ich war mir dessen nicht bewusst. Downvote rückgängig gemacht. –

+1

Danke, sztomi! –

1

Die Webclient Klasse bietet alles, was Sie brauchen. Um die speziellen Codierungsfälle zu behandeln, laden Sie das Dokument als Byte-Stream herunter und tun Sie dann, was notwendig ist.

0

sztomi ist richtig, die Webclient-Klasse kann wahrscheinlich tun, was Sie brauchen.

Wenn Sie mit dem HTML analysieren und arbeiten müssen, die HTML Agility Pack-Check-out (http://www.codeplex.com/htmlagilitypack)

„Dies ist ein agiler HTML-Parser, der ein Lese-/Schreib-DOM baut und schlicht XPath oder XSLT unterstützt (Sie MÜSSEN XPATH oder XSLT eigentlich nicht verstehen, um es zu benutzen, mach dir keine Sorgen ...) Es ist eine .NET-Code-Bibliothek, die es ermöglicht, HTML-Dateien "aus dem Web" zu parsen. Der Parser ist sehr tolerant "real world" falsch formatiertes HTML. Das Objektmodell ist dem sehr ähnlich, was System.Xml vorschlägt, aber für HTML-Dokumente (oder Streams). "

Verwandte Themen