Mögliche Duplizieren:
Javascript RegExp + Word boundaries + unicode charactersRegex Wortgrenze b hat Probleme mit Umlauten (Sonderzeichen in deutscher Sprache)
In ECMA Script regex (hier als Referenz getestet: http://regexpal.com/) bekomme ich Fehlalarme mit Wortgrenzen (unter Verwendung von \b
) und Umlauten. Zum Beispiel
regex \bPflanzen\b
sollte nicht "Pflanzenöl" entsprechen, aber es tut. Wenn ich den ö
zu einem oe
ändere, funktioniert alles. Regex scheint Umlaute nicht als Teil von Wörtern zu betrachten, obwohl sie in vielen Sprachen sind.
Was ist die beste Problemumgehung?
... und die beste Problemumgehung ist, XRegExp zu verwenden, wie [diese Antwort] (http://stackoverflow.com/a/10591266/20938) empfiehlt. –