2016-07-08 6 views
1

Ich schreibe eine CSV-Datei in Hindi (Sprache), wenn ich es analysieren, bekomme ich unterschiedliche Ergebnisse.Lesen Sie eine CSV-Datei mit Sonderzeichen (andere gesprochene Sprache)

Zum Beispiel mache ich unter csv-Datei.

1234444070;आज आप कैसे हैं??? 

Wenn ich die gleiche Datei mit open(csv_aws_url).read lesen. Ich bekomme:

"1234444070;\xE0\xA4\x86\xE0\xA4\x9C \xE0\xA4\x86\xE0\xA4\xAA \xE0\xA4\x95\xE0\xA5\x88\xE0\xA4\xB8\xE0\xA5\x87 \xE0\xA4\xB9\xE0\xA5\x88\xE0\xA4\x82???\r\n" 

Kann dies passieren, dass ich den gleichen Inhalt beim Parsen lesen?

+0

Versuchen Sie, 'puts' vor Ihr' open' zu setzen. Es sieht so aus, als ob Sie nur die Ausgabe "String # inspect" sehen, die nur eine andere visuelle Darstellung derselben Daten darstellt. –

Antwort

0
open(csv_aws_url).read.force_encoding('utf-8') 
Verwandte Themen