Ich versuche, diese Webseite mit C# WebClient herunterladen .. Jetzt funktioniert es perfekt mit Python urllib2 aber mit C# Web-Client gibt es diese seltsamen Zeichen in der Ausgabedatei ..C# WebClient merkwürdige Charaktere
ich versucht habe, als auch unter Verwendung von Encoding mit WebClient-Klasse, aber es hat nicht funktioniert ..
public static string GetWebURL()
{
string url = "http://bet.hkjc.com";
WebClient webClient = new WebClient();
webClient.Encoding = Encoding.UTF8;
string html = webClient.DownloadString(url);
File.WriteAllText("page.html", html);
}
dies die Ausgabe mit diesen seltsamen Zeichen ist
‹âå²Qtñw‰pUðñõQuòñtVPÒÕ×7vÖ×w qÂH˜è*„%æg–dæç%æèë»ú)ÙñrÂ(N.Ê,(Q(©,HµU*IÂ(ÑÃJ,K„ˆ*Ùq)((â€U*TÆ’e‰E ©y‰I9©ŽÉÉ©ÅÅÎùy%Eù9 ¶i‰9Å©Ö %â„¢i Xâ€h"(É-P°U(ÃÃŒKÉ/×ËÉON¹H/£(5M¯¸4©¸¤HÃ\SlHu°kPËœkP¼Ÿ£¯+PP/L‘ÂËœ4&µÂ?MCI_IS®+%?713Ã/17¨ ɘfd!¸ zJšÚ†P«Sò“KsSóJô &MA V¨ŸKòô’RK‚s2ÜŠ€ªô2‹}òÓóó445¡ÊÃ=ÂWâ€Z“˜œ t|zj^jQbN<Ø1z䁚9‰y鶩yJ_ÂP-ˆÔšœchˆe¦‚ µ\H&[×rÙèC’€0ÂJ%à „ ÷‚üüP9Ud¦MÃÃÔÌØÈÖM×ÃÈ25² ÷ô³V·†(ÃŽM-JOM
Was soll ich tun, um den HTML-Code zu sehen, der gesendet wird?
oder dies: http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=09- 06-2016 & venue = HV & lang = en – user3752779
Bitte zeigen Sie die gleiche Anstrengung beim Schreiben Ihrer Frage, die Sie erwarten, dass jemand die Frage beantwortet. Vielleicht ein Code, wie Sie die Seite "herunterladen". Beispiel für die seltsamen Charaktere und so weiter. – Peter4499
Das ist definitiv nicht UTF8 - die Seite scheint chinesisch zu sein und UTF8 unterstützt es nicht.Propagably Unicode sollte für Sie arbeiten – Peter4499