2016-05-02 8 views
2

Was bedeuten diese Ausdrücke? Wo kann ich über ihre Verwendung erfahren?

\\d 
\\D 
\\s 
\\S 
\\w 
\\W 
\\t 
\\n 
^ 
$ 
\ 
| etc.. 

Ich brauche das stringr Paket verwenden, und ich habe absolut keine Ahnung, wie diese zu verwenden.

+2

Wir erwarten normalerweise einige Code Frage, zusammen mit Aufwand und Daten und gewünschte Ausgabe. Sie können nach '? Regexp', http://regexr.com/, http://regexone.com/, Google usw. suchen. –

+0

Innerhalb von R geben Sie diesen'? Regex' ein, um Informationen über reguläre Ausdrücke zu erhalten.Es gibt auch Links zu Tutorials und anderen Informationen am Ende dieser Seite: https://code.google.com/archive/p/gsubfn/ –

Antwort

3

Von ?regexp in den Erweiterte Reguläre Ausdrücke Abschnitt:

Das Caret ‚^‘ und das Dollarzeichen ‚$‘ sind Metazeichen, dass jeweils am Anfang und Ende einer die leere Zeichenkette übereinstimmen Linie. Die Symbole '\ <' und '>' stimmen mit der leeren Zeichenkette am Anfang und Ende eines Wortes überein. Das Symbol '\ b' stimmt mit der leeren Zeichenfolge an jeder Kante eines Wortes überein, und '\ B' stimmt mit der leeren Zeichenfolge überein, sofern es sich nicht an einer Kante eines Wortes befindet. (Die Interpretation der 'Wort' ist abhängig von der locale und Umsetzung: Das sind alle Erweiterungen.)

Von Perl-like Reguläre Ausdrücke:

Die '\ d' Escape-Sequenzen , '\ s' und '\ w' stehen für eine Dezimalzahl Ziffer, Leerzeichen und 'Wort' Zeichen (Buchstabe, Ziffer oder Unterstrich im aktuellen Gebietsschema: im UTF-8-Modus werden nur ASCII-Zeichen bzw. Ziffern berücksichtigt) und ihre Großbuchstaben Versionen repräsentieren ihre Negation. Die Registerkarte "Vertikal" wurde nicht als als Leerzeichen in einem Gebietsschema "C" vor PCRE 8.34 betrachtet (enthalten in R 3.0.3). Die Sequenzen '\ h', '\ v', '\ H' und '\ V' stimmen mit dem horizontalen und dem vertikalen Abstand oder der Negation überein. (In UTF-8-Modus, tun diese Nicht-ASCII-Unicode-Codepunkten.)

Beachten Sie, dass Schrägstriche müssen in der Regel in R-Eingang verdoppelt/geschützt werden, z.B. Sie würden "\\h" verwenden, um den horizontalen Abstand anzupassen.

Von ?Quotes:

Aufkantung wird verwendet Konstanten eine Escape-Sequenz innerhalb Charakter zu starten. Das Auslassen eines Zeichens, das nicht in der folgenden Tabelle enthalten ist, ist ein Fehler.
\ n Newline
\ r Wagenrücklauf
\ t Register

Wie andere über einen Kommentar, können Sie ein wenig mehr Hilfe benötigen, wenn Sie mit regulären Ausdrücken zum ersten Mal am Anfang. Dies ist ein wenig Off-Topic für StackOverflow (Links zu externen Ressourcen), aber es gibt einige Links zu Ressourcen für reguläre Ausdrücke am Ende der gsubfn package overview. Oder Google "Regular Expression Tutorial" ...

+1

'\ n' und' \ t' sind in den "Charakterkonstanten" beschrieben. Abschnitt der Hilfeseite "? Zitate". –

+0

@RichieCotton, fühlen Sie sich frei zu bearbeiten, wenn Sie möchten. (Sollte diese Antwort Community Wiki sein?) –

Verwandte Themen