2016-11-27 1 views

Antwort

4

Die Grammatik Produktionen, die Sie brauchen, sind direkt im Dokument, das Sie verknüpft.

[9] STRING_LITERAL_QUOTE ::= '"' ([^#x22#x5C#xA#xD] | ECHAR | UCHAR)* '"' 
[141s] BLANK_NODE_LABEL ::= '_:' (PN_CHARS_U | [0-9]) ((PN_CHARS | '.')* PN_CHARS)? 
[10] UCHAR ::= '\u' HEX HEX HEX HEX | '\U' HEX HEX HEX HEX HEX HEX HEX HEX 
[153s] ECHAR ::= '\' [tbnrf"'\] 

Das bedeutet, dass ein String-Literal beginnt und endet mit einem doppelten Anführungszeichen (") Innerhalb der doppelten Anführungszeichen, Sie können haben:

  • jedes Zeichen mit Ausnahme von:. # x22, # x5C, #xA, #xD Offhand, ich weiß nicht, was jeder von denen ist, aber ich würde davon ausgehen, dass sie den Raum sind Zeichen in den Escapes abgedeckt;
  • ein Unicode-Zeichen Repres Eingeschlossen mit einem \ u gefolgt von vier Hex-Ziffern oder einem \ U gefolgt von acht Hex-Ziffern; oder
  • ein Escape-Zeichen, das ein \ durch jedes t, b, n, r, f,“,‘, und \, die repräsentieren verschiedene Personen.
1

Neben Joshs Antwort folgt. Es ist fast immer eine gute Idee, Unicode-Daten zu NFC zu normalisieren.Weitere Informationen finden Sie unter: http://www.macchiato.com/unicode/nfc-faq. zB in Java können Sie die folgende Routine

verwenden