2016-12-22 3 views
1

Ich stecke damit fest, also, bitte, jeder Rat ist willkommen.Extrahieren Sie nur Wörter, die ASCII-Zeichen aus Vektor der Zeichenfolgen enthalten

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) 

Gibt eine Liste:

List of 2 
$ : chr [1:2] "hello" "ring" 
$ : chr "trust" 

Aber ich will für jedes Element des Vektors c('hello ringпрг','trust') wie "hello ring", "trust" einen Vektor mit Saiten dieser Worte haben. Andere Funktionen und Pakete sind ebenfalls willkommen.

+1

Es gibt keine Möglichkeit, nur englische Wörter ohne Wörterbuch zu extrahieren. Nun, wenn Sie wirklich ASCII-Zeichen extrahieren wollen ... – Roland

+0

@Roland haben Sie Recht, Titel bearbeitet – Shin

Antwort

2

Verwendung sapply mit paste wie in verwenden:

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE)) 

sapply(b, paste, collapse = " ") 

## [1] "hello ring" "trust" 
2

Wir

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE))) 
#[1] "hello ring" "trust" 

verwenden oder das Muster als "[[:ascii:]]+"

Verwandte Themen