2016-08-15 1 views
0

Ich versuche, eine Website Quelle in C# erhalten mitC# Get Website-Quellcode mit Buchstaben anders als Englisch

WebClient client = new WebClient(); 
string content = client.DownloadString(url); 

Und es wird es einfach gut. Der Quellcode enthält jedoch hebräische Zeichen, die wie Gibbrish in der Inhaltsvariablen angezeigt werden. Was muss ich tun, um es zu erkennen?

Antwort

0

Das Problem ist die Kodierung Ihres WebClients. MSDN sagt:

... Die Methode verwendet die in der Eigenschaft Encoding angegebene Codierung, um die Ressource in einen String zu konvertieren.

Lösung: Stellen Sie eine spezifische Kodierung wie

client.Encoding = Encoding.UTF8; 

und versuchen Sie es erneut

string content = client.DownloadString(url); 

UTF8 sollte es tun auch die hebräischen Zeichen zu kodieren.

+0

Super funktioniert, danke! – Erez

1
WebClient client = new WebClient(); 
client.Encoding = System.Text.UTF8Encoding.UTF8; // added 
string content = client.DownloadString(url); 

Sie müssen die Kodierung angeben, wahrscheinlich fordern Sie standardmäßig ASCII an und der Inhalt könnte in UTF8 sein. Dies ist ein Beispiel, in dem die Codierung auf UTF8 festgelegt ist. Wenn Sie nicht sicher sind, was es ist, überprüfen Sie die Quelle zuerst manuell und geben Sie dann die Codierung entsprechend an. Weitere Informationen finden Sie in der Dokumentation unter Remarks.

+0

Großartig funktioniert, danke! – Erez

Verwandte Themen