Wenn ich eine Python Unicode-Zeichenfolge habe, die kombinierende Zeichen enthält, meldet len
einen Wert, der nicht der Anzahl der Zeichen "gesehen" entspricht.Wie bekomme ich die "sichtbare" Länge einer kombinierenden Unicode-Zeichenfolge in Python?
Zum Beispiel, wenn ich eine Zeichenfolge mit der Kombination von Überstrichen und Unterstreichungen wie u'A\u0332\u0305BC'
, len(u'A\u0332\u0305BC')
Berichte 5 habe; Die angezeigte Zeichenfolge ist jedoch nur 3 Zeichen lang.
Wie bekomme ich die "sichtbar" - das heißt, die Anzahl der verschiedenen Positionen von der Zeichenfolge, die der Benutzer sieht - Länge einer Unicode-Zeichenfolge mit kombinierenden Glyphen in Python?
hmm das ist interessant, das beste ich ca n denke daran, nur die unerwünschten Zeichen zu entfernen. – postelrich
@riotburn: Das wird schwierig sein. Die Zeichen könnten beliebig sein (vom Benutzer bereitgestellt). Ich müsste eine Liste der Unicode-Glyphen zusammensuchen - es sei denn, dies ist ein systematischer Teil der Kodierung. – orome