Ich habe eine harte Zeit, Elemente zwischen einem /
und einem black space
zu extrahieren. Ich kann dies tun, wenn ich zwei Zeichen wie <
und >
zum Beispiel habe, aber der Platz wirft mich. Ich hätte gerne den effizientesten Weg, dies in Base R as zu tun. Dies wird auf Tausende von Vektoren angewendet werden.Elemente zwischen einem Zeichen und Leerzeichen extrahieren
Ich möchte dies drehen:
x <- "This/DT is/VBZ a/DT short/JJ sentence/NN consisting/VBG of/IN some/DT nouns,/JJ verbs,/NNS and/CC adjectives./VBG"
dieses:
[1] "DT" "VBZ" "DT" "JJ" "NN" "VBG" "IN" "DT" "JJ" "NNS" "CC" "VBG"
EDIT:
Vielen Dank für die Antworten. Ich gehe auf Geschwindigkeit, damit der Andres-Code gewinnt. Dwins Code gewinnt für die größte Menge an Code. Dirk war der Zweitschnellste. Die Stringr-Lösung war die langsamste (ich dachte, es wäre) und war nicht in der Basis, aber ist ziemlich verständlich (was wirklich die Absicht des stringr-Pakets ist, denke ich, da dies Hadleys Philosophie mit den meisten Dingen zu sein scheint.
Vielen Dank für Ihre Unterstützung Danke nochmal
ich dachte, ich würde das Benchmarking enthalten, da diese lapplied
über mehrere tausend Vektoren werden:..
test replications elapsed relative user.self sys.self
1 ANDRES 10000 1.06 1.000000 1.05 0
3 DIRK 10000 1.29 1.216981 1.20 0
2 DWIN 10000 1.56 1.471698 1.43 0
4 FLODEL 10000 8.46 7.981132 7.70 0
ich, dass man mögen. Kompakt und erfordert nicht die Länge des Zwischenergebnisses zu betrachten. –
Regex lässt mich Bier brauchen. –