Ich verwende Posix C Regex-Bibliothek (Regcomp/Regexec) auf meiner Suchanwendung. Meine Anwendung unterstützt verschiedene Sprachen einschließlich solcher, die Multi-Byte-Zeichen verwenden. Beim Verwenden des Metazeichens für die Wortgrenze (\ b) tritt ein Problem auf. Für Single-Byte-Strings, es funktioniert gut, zum Beispiel:Regex-Wortgrenze für Multi-Byte-Strings
"\ bpaper \ b" Streichhölzer "Papier"
Wenn jedoch die regex und Query-Strings Multi-Byte ist, scheint es nicht, korrekt zu arbeiten, zum Beispiel:
"\ b 紙張 \ b" stimmt nicht überein "紙張"
Bin ich etwas fehlt? Jede Hilfe würde sehr geschätzt werden.
Gewünscht Info:
- Programmiersprache: C
- Regex Library: GNU C (regex.h)
Dank.
Könnten Sie uns bitte mitteilen, welche Programmiersprache/Bibliothek Sie für RegExp verwenden? –
@ Ferdinand: angeforderte Informationen hinzugefügt. –