2016-03-24 19 views
0

Es ist mein Verständnis, dass TXT-Dateien keine Codierungsinformationen gespeichert haben, so dass Text-Editoren einfach Vermutungen über die Codierung einer bestimmten Textdatei machen und dann die Datei auf dem Bildschirm mit dieser vermuteten Codierung anzeigen. Wenn der Redakteur richtig geraten hat, bekommst du deinen Text auf dem Bildschirm, wenn der Redakteur falsch geraten hat, dann bekommst du (manchmal) Kauderwelsch. Bekomme ich das soweit?Erkennung von Codierungen in Excel

Nun zu meinem Problem. Ich habe meine Kontoauszüge in einer CSV-Datei. Wenn ich es in MS Excel 14 (MS Office 2010) öffne, erkennt es die Kodierung und zeigt die problematische Arbeit als "obračun" an. Groß. Wenn ich die Datei in Emacs 24.3.1 öffne, erkennt es die korrekte Codierung nicht und zeigt das problematische Wort als "obra 鑾 n" an. Nicht so toll.

Meine Frage ist: Wie frage ich Excel, in welcher Kodierung die Datei ist? Das kann ich Emacs sagen, da Excel offensichtlich richtig geraten hat.

Danke.

+0

* "Bekomme ich das soweit richtig?" * Wenn Sie mit * "txt files" * einfache Textdateien meinen, die nur die Bytes enthalten, aus denen die Zeichen bestehen, dann ja. Sehen Sie sich Ihre Dateien in einem Hex-Editor an, wenn Sie Zweifel haben. Microsoft Office-Dateien sind jedoch keine einfachen Textdateien. Z.B. .docx ähnelt eher einem Zip-Archiv als einer einfachen Textdatei. [Diese Frage] (https://stackoverflow.com/questions/13235189/how-can-i-determine-the-character-encoding-of-o-excel-file) könnte hilfreich sein – jDo

Antwort

0

Dies könnte eine mögliche Antwort sein: http://metty-mathews.blogspot.si/2013/08/excel2013-character-encoding.html

Nachdem ich 'Erweitert' geöffnet - 'Web Optionen' - 'Encoding', so heißt "Central European (Windows)" in "speichern Dieses Dokument als:" Feld . Es stellt sich heraus, dass Microsoft der Name für Windows-1250-Codierung ist und es stellt sich heraus, dass meine Datei tatsächlich mit dieser Codierung codiert wurde.

Ist das nur Zufall oder zeigt dieses Feld wirklich an, in welcher Codierung Excel Text anzeigt - das weiß ich nicht.

+1

Wenn Sie zwei der drei Variablen kennen Könntest du nicht den dritten bekommen? Die Variablen sind 1. Codierung verwendet, 2. Byte-Wert, 3. resultierende Zeichen auf dem Bildschirm angezeigt. Welche Codierung würden Sie benötigen, um den Byte-Wert X auf dem Bildschirm in das Zeichen Y umzuwandeln? Welchen Byte-Wert müssen Sie haben, damit X auf dem Bildschirm das Zeichen Y erzeugt? Welches Zeichen würde auf dem Bildschirm erscheinen, wenn der Byte-Wert X mit der Kodierung Y interpretiert wurde? Sie kennen das Zeichen auf dem Bildschirm und Sie könnten den Byte-Wert wahrscheinlich mit einem Hex-Editor finden. Das würde Ihnen eine oder mehrere mögliche Kodierungen geben (sie können sich überschneiden). – jDo

+1

Gute Idee. Das nächste Mal, wenn ich mit unbekannter Kodierung festhalte, werde ich versuchen, so etwas zu kodieren. Tnx. – dijxtra

+0

Cool cool. Hast du die Kodierung herausgefunden? – jDo