Gibt es eine Möglichkeit, den ersten Buchstaben einer UTF-8-codierten Zeichenfolge mit Lua zu extrahieren?Extrahieren Sie den ersten Buchstaben einer UTF-8-Zeichenfolge mit Lua
Lua unterstützt Unicode nicht ordnungsgemäß, daher gibt string.sub("ÆØÅ", 2, 2)
anstelle von "Ø"
zurück.
Gibt es einen relativ einfachen UTF-8-Parsing-Algorithmus, den ich für das String-Byte pro Byte verwenden könnte, um den ersten Buchstaben der Zeichenfolge zu erhalten, sei es ein chinesisches Zeichen oder ein A?
Oder ist dieser Weg zu komplex, erfordert eine große Bibliothek usw.?
"* einfacher Unicode-Parsing-Algorithmus *" Was * Art * von "Unicode" ist das? Ist es UTF-8, UTF-16, etwas anderes? Was ist die Codierung? –
http://www.joelonsoftware.com/articles/Unicode.html Lesen Sie dies. Bitte. – Cubic
Hier ist auch eine [Seite für Lua Benutzer] (http://lua-users.org/wiki/LuaUnicode) –