Ich versuche, alle Token in einem Text auszuwählen und müssen alle Ascii und Unicode-Zeichen übereinstimmen, also hier ist, wie ich sie ausgebreitet habe.Wie finde ich Unicode-Zeichen in antlr
fragment CHAR : ('A'..'Z') | ('a'..'z');
fragment DIGIT : ('0'..'9');
fragment UNICODE : '\u0000'..'\u00FF';
Nun, wenn ich meine Token-Regel schreiben wie:
TOKEN : (CHAR|DIGIT|UNICODE)+;
ich 'A' „Decision Eingang wie mithalten kann ".. 'Z'" mit mehreren Alternativen: 1, 3 Als Ergebnis wurden die Alternative (n) 3 für den Eingang " " deaktiviert. Die Entscheidung kann Eingaben wie "'0' .. '9'" unter Verwendung mehrerer Alternativen treffen: 2, 3 Als Ergebnis, Alternative (n) 3 wurden für diesen Eingang deaktiviert "
Und nichts wird abgestimmt: Und auch wenn ich es als
TOKEN : (UNICODE)+;
Nichts schreiben wird abgestimmt.
Gibt es eine Möglichkeit, dies zu tun.
‚\ u0000‘ .. ‚\ u00FF‘ umfasst nicht „alle Unicode-Zeichen“, es nur deckt die ersten 256. –
Das auch. Das habe ich vermisst! –
True, aber ich dachte, Java unterstützt noch nicht fünfstelligen Unicode. – Lezan