2012-06-20 6 views
7

Ich habe eine Excel-Datei in der bengalischen Sprache. Um den Bengali-Text richtig anzuzeigen, benötige ich Bengali-Schriftarten, die auf dem PC installiert sind.Bengali-Sprache Text nicht in Unicode-CSV-Datei angezeigt

Ich konvertierte die Excel-Datei in CSV mit Office 2010. Aber es zeigt nur "?" Marken anstelle der bengalischen Zeichen. Dann habe ich die Google Docs für die Konvertierung verwendet, mit dem gleichen Problem, aber mit unlesbaren Zeichen statt "?" S. Ich habe Ausschnitte aus dieser Datei in eine HTML-Datei eingefügt und versucht, sie in meinem Browser nicht erfolgreich anzuzeigen.

Was kann ich tun, um eine CSV-Datei aus einer .xlsx-Datei in Bengali zu erhalten, damit ich diese in eine MySQL-Datenbank importieren kann?

Bearbeiten: Die Antwort in this SO Frage akzeptiert hat mich auf Google Docs gehen.

Antwort

3

Laut den Antworten auf die Frage Excel to CSV with UTF8 encoding sollte Google Docs im Gegensatz zu Excel CSV korrekt speichern, wodurch alle Zeichen zerstört werden, die in der verwendeten "ANSI" -Kodierung nicht dargestellt werden können. Aber vielleicht haben sie das geändert, oder etwas stimmt nicht, oder die Analyse der Situation ist falsch.

Für richtig kodierte Bangla (Bengali) in MS Office-Programmen verarbeitet, sollte es keine "Bangla Fonts" geben, da die Arial Unicode MS Schriftart (im Lieferumfang von Office enthalten) die Bangla-Zeichen enthält. Sind die Daten tatsächlich in einer nicht standardmäßigen Codierung, die auf einer speziell codierten Schriftart beruht? In diesem Fall sollte es zuerst in Unicode konvertiert werden, obwohl es möglicherweise mithilfe von Programmen verwaltet werden kann, die konsistent diese spezifische Schriftart verwenden.

In Excel können Sie bei Verwendung von Speichern unter "Unicode-Text (* .txt)" auswählen. Es speichert die Daten als TSV (tab-separated values) in der UTF-16-Codierung. Möglicherweise müssen Sie es dann konvertieren, um Komma als Trennzeichen anstelle von Tabulatorzeichen und/oder von UTF-16 nach UTF-8 zu verwenden. Dies funktioniert jedoch nur, wenn die Originaldaten korrekt codiert sind.

+0

wie man diese Umwandlung macht, um Komma als Trennzeichen anstelle von Tab und/oder von UTF-16 zu UTF-8 zu verwenden? Die Excel-Datei zeigte die Bangla-Schriften gut. Also kann ich davon ausgehen, dass die Originaldaten richtig codiert wurden. Recht ? –

+0

Ich habe die Konvertierung durchgeführt, indem ich den 'save as' Typ als 'Unicode Text (.txt)' ausgewählt habe, aber immer noch '?' Noten erschienen wie zuvor. –

+0

@Istiaque Ahmed, es sieht wirklich so aus, als wären die Originaldaten nicht richtig kodiert. Wenn es eine nicht standardmäßige 8-Bit-Kodierung verwendet, kann es bei Programmen, die eine bestimmte Schriftart verwenden, jedoch OK sein, aber nicht funktionieren, wenn normale Schriftarten verwendet werden, und Datenkonvertierungen können die Daten durcheinander bringen. Welche Bangla-Schriftart verwendest du? –

Verwandte Themen