Ich arbeite in Text Mining mit spanischen twitts, mein Problem ist, dass ich die gleichen Worte habe, aber auf verschiedene Arten (mit Akzent und ohne Akzent), Beispiel: Accion, acción.Reinigung Akzent im Text Twitter
Ich habe versucht, Codierung zu verwenden: Unicode "UTF-8", aber nicht funktionieren. meiner Bibliothek Bibliothek (stringi) Bibliothek (TWITTER) Bibliothek (tm) Bibliothek (Wordcloud) Bibliothek (RColorBrewer)
Bitte lesen Sie die Informationen zu ändern, [wie eine gute Frage] (http : //stackoverflow.com/help/how-to-ask) und wie man ein [reproduzierbares Beispiel] gibt (http://stackoverflow.com/questions/5963269). Dies wird es anderen sehr erleichtern, Ihnen zu helfen. – zx8754
Was Sie tun könnten, ist eine "Datenbank" von Akzentbuchstaben und was sie übersetzen zu schaffen. Wenden Sie das dann auf einzelne Tweets an und "akzentuieren" Sie akzentuierte Zeichen. Sie können zum Beispiel 'sub' verwenden. –