Ich schreibe eine CSV-Datei in Hindi (Sprache), wenn ich es analysieren, bekomme ich unterschiedliche Ergebnisse.Lesen Sie eine CSV-Datei mit Sonderzeichen (andere gesprochene Sprache)
Zum Beispiel mache ich unter csv-Datei.
1234444070;आज आप कैसे हैं???
Wenn ich die gleiche Datei mit open(csv_aws_url).read
lesen. Ich bekomme:
"1234444070;\xE0\xA4\x86\xE0\xA4\x9C \xE0\xA4\x86\xE0\xA4\xAA \xE0\xA4\x95\xE0\xA5\x88\xE0\xA4\xB8\xE0\xA5\x87 \xE0\xA4\xB9\xE0\xA5\x88\xE0\xA4\x82???\r\n"
Kann dies passieren, dass ich den gleichen Inhalt beim Parsen lesen?
Versuchen Sie, 'puts' vor Ihr' open' zu setzen. Es sieht so aus, als ob Sie nur die Ausgabe "String # inspect" sehen, die nur eine andere visuelle Darstellung derselben Daten darstellt. –