Ich versuche, eine Datei zu lesen, die Urdu-Daten haben. Wenn ich die Datei in Notepad ++ anzeigen, hat es Daten in Urdu. Aber wenn ich es in Eclipse ansehe, dann zeigt es irgendeine Art von Kodierung (vielleicht hat es einen Standard).Urdu-Datei lesen in Java
Original-Urdu Daten (Notepad ++):
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے فی کلو ہوگیا","Entertainment"
in Eclipse:
"10","کراچی میں ٹماٹر کی قیمت میں کمی،25روپے �ی کلو �وگیا","Entertainment"
Nun ist dies standardmäßig seltsam einige Codierung geschehen ist. Gibt es eine Möglichkeit, dass ich Daten in der ursprünglichen Form erhalten kann, so dass, wenn ich etwas Verarbeitung darauf mache und es in Datei schreibe, ich verarbeitete Daten in der ursprünglichen Urdu-Form statt jeder Kodierung will.
Hier ist der Code.
public class DataProcessing {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
DataProcessing dataProcessingObj = new DataProcessing();
dataProcessingObj.readDataFromFile("small_dataset.txt");
}
private void readDataFromFile(String fileName)
{
BufferedReader br = null;
try{
br = new BufferedReader(new FileReader(fileName));
String line = "";
while((line = br.readLine()) != null)
{
System.out.println(line);
}
}
catch(Exception ex){
ex.printStackTrace();
}
}
}
Wenn Sie mir helfen können, werde ich Ihnen dankbar sein.
In welcher Zeichencodierung wird die Datei gespeichert? Wie liest du den Inhalt der Datei und zeige ihn in deiner Bewerbung an? – Jesper
Code wird in Frage gestellt. –
@Jesper Wie kann ich wissen, in welcher Zeichenkodierung meine Datei gespeichert ist? –