Ich benutze Agility Pack, um HTML zu analysieren, folgende Frage What is the best way to parse html in C#? und ich bekomme tolle Ergebnisse :) Das Problem kommt, wenn ich in einigen Webseiten entre die Ergebnisse basieren auf meinem Standort, so für Beispiel wie ich bin in Spanien, ich bekomme die Ergebnisse für die Region Spanien und ich würde gerne ändern, als ob ich in England wäre, wie kann es gemacht werden? Ich meine, dass ich etwas im User Agent ändern muss? (Ich benutze als Benutzer-Agent "Mozilla/5.0 (Windows; U; Windows NT 5.1; de-US; rv: xxx) Gecko/20041107 Firefox/xx)"HTML Agility Pack Einstellungen
5
A
Antwort
9
Sie könnten die WebClient.DownloadString
-Methode, die Sie verwenden können Legen Sie HTTP-Anforderungsheader fest, um den Inhalt der Webseite herunterzuladen und an HTML agility Pack zu füttern.
Der UserAgent steuert nicht die Sprache. Es ist der Accept-Language
Header. So zum Beispiel:
using (var client = new WebClient())
{
client.Headers[HttpRequestHeader.AcceptLanguage] = "es-ES";
client.Headers[HttpRequestHeader.UserAgent] = "some user agent if you wish";
string html = client.DownloadString("http://example.com");
// feed the HTML to HTML Agility Pack
var doc = new HtmlDocument();
doc.LoadHtml(html);
// now do the parsing
}
Aber wenn die Site IP-basierte Erkennung verwendet, um Sie Inhalte in verschiedenen Sprachen zu senden gibt es nicht viel Sie von der Client-Seite tun könnten, das zu ändern.
1
location-basierte Suche oder Seiten werden in der Regel über ip durchgeführt, oder wenn Sie sich registrieren, sagen Sie der Website, wo Sie sind. Vielleicht möchten Sie in einem Anon-Proxy in dem Land aussehen, wie Sie aussehen möchten.
Verwandte Themen
- 1. HTML Agility Pack-
- 2. HTML Agility Pack-Fehler
- 3. HTML Agility Pack
- 4. Advanced HTML Agility Pack-useage
- 5. Html Agility Pack - Neues HtmlAttribute
- 6. Html Agility Pack, SelectNodes von einem Knoten
- 7. HTML Agility Pack - Filter Href Wert Ergebnisse
- 8. Web Schaben Daten mit Html Agility Pack-
- 9. Html Agility Pack. Laden und scrape Webseite
- 10. Html Agility Pack: Kommentar-Knoten finden
- 11. Analysieren Formular mit HTML-Agility Pack
- 12. Auswahl Attributwert mit HTML Agility Pack-
- 13. bekommen Titel-Tag von HTML Agility Pack
- 14. Stripping alle HTML-Tags mit Html Agility Pack-
- 15. Inhalt zwischen zwei HTML-Tags mit Html Agility Pack
- 16. greifen alle Text aus HTML mit Html Agility Pack-
- 17. Wie dynamisch HTML-Code mit HTML Agility Pack analysieren?
- 18. Html Agility Pack - wie richtige Span-Klasse wählen
- 19. Encoding Fehler bei der Verwendung von HTML Agility Pack-
- 20. Html Agility Pack-Schleife durch Tabellenzeilen und -spalten
- 21. Html Agility Pack-Innerhtml gibt falsche Zeichenfolge mit area per
- 22. Html Agility Pack Holen Sie sich alle Elemente nach Klasse
- 23. HTML Agility Pack Strip-Tags NICHT in der Whitelist
- 24. HTML-Agility-Pack erhalten alle Divs mit Klasse
- 25. Html Agility Pack erstellen irrelevante Zeichen auf HtmlDocument laden
- 26. Kann ich das Html Agility Pack dafür verwenden?
- 27. HTML Agility Pack bekomme alle Anker 'href Attribute auf Seite
- 28. HTML Agility Pack Wählen Sie Knoten mit mehreren Attributen
- 29. HTML Agility Pack - Wählen Sie Knoten nach bestimmten Knoten
- 30. HTML-Agility-Pack ist die Rückkehr Javascript-Code mit Ausnahme der tatsächlichen Html
Ich habe den WebClient auch verwendet, und im HTML-Inhalt habe ich -> lang = "es", so die Frage ist, wie kann ich auf Englisch wechseln? – jobormo
Großartig! das ist, was ich wollte, mach dir keine Sorgen die Websites verwendet keine IP-Erkennung :) – jobormo