Wie konvertiert man vietnamesischen Text in normalen Text?

Ich habe ein Vietnamese Text wie folgt aus:Wie konvertiert man vietnamesischen Text in normalen Text?

String text = "Xin chào Việt Nam";

Und ich will es in den normalen Text konvertieren. Mein erwartetes Ergebnis:

String result = " "Xin chao Viet Nam";

Wie kann ich das tun? Vielen Dank.

Quelle

2016-05-05 CauCuKien

Sie suchen nach Normalizer in java.text.Normalizer . Es ermöglicht Ihnen, zwischen Unicode-Zeichen mit Akzenten und ihren Dekompositionen zu mappen:
Es konvertiert im Grunde alle akzentuierten Zeichen in ihre deaccented Gegenstücke gefolgt von ihrer Kombination Diakritika. Jetzt können Sie eine Regex verwenden, um die diakritischen Zeichen zu entfernen.

 public static void main(String[] args) { 

      System.out.println(deAccent("Xin chào Việt Nam")); 
     } 

     public static String deAccent(String str) { 
      String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); 
      Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+"); 
      return pattern.matcher(nfdNormalizedString).replaceAll(""); 
     }

Quelle

2016-05-05 12:48:35

Ich liebe dich @Ahmed Gamal – CauCuKien

@CauCuKien Sie sind willkommen :) –

aber Eingang mit String "đi", deAccent ("đi") ist das Ergebnis gegeben "đi". Es normalisiert Text nicht effektiv – VanThaoNguyen

Wie konvertiert man vietnamesischen Text in normalen Text?

Antwort

Verwandte Themen