Ich bin auf der Suche nach einer kleinen C-Bibliothek mit UTF8-Strings zu behandeln.Light C Unicode-Bibliothek
Speziell Splitting basierend auf Unicode-Trennzeichen für die Verwendung mit Stemming-Algorithmen.
Related posts haben vorgeschlagen: http://utfcpp.sourceforge.net/ (ausgezeichnet, aber C++ nicht C)
Hat:
ICU http://www.icu-project.org/
UTF8-CPP (I für meine Zwecke auf Embedded-Geräten es zu sperrig gefunden) Jeder fand plattformunabhängige, kleine Codebasis-Bibliotheken für die Behandlung von Unicode-Strings (muss keine Einbürgerung durchführen).
utf8-cpp ist großartig! portiert reibungslos zu ios/android. header only libarary – barney