Extrahieren einer Zeichenfolge basierend auf Position gefunden Charakter in R

fand ich im folgenden Satz die Positionen von „oo“ aus:Extrahieren einer Zeichenfolge basierend auf Position gefunden Charakter in R

sentence <- "It is a good book. Good for first reading. 
This book explains everything in Qdetail with tons of examples and exercises for practice. Good for cracking written tests on campuses and competitive exams. It is cheap so any way one can have a copy along with other books" 

pos = gregexpr("oo", sentence)

ich das Ergebnis als

bekam

> pos 
[[1]] 
[1] 10 15 21 50 136 263 
attr(,"match.length") 
[1] 2 2 2 2 2 2 
attr(,"useBytes") 
[1] TRUE

Basierend auf den Ergebnis, ich möchte 10 Zeichen aus jeder Position extrahieren (5 vor der Position und 5 nach der Position)

Für ein Beispiel, Ich sollte Ergebnis für den ersten Speicherort alserhalten"s ein gutes bo" Und ich möchte diese Extraktion für jede Position. Da ich neu bei R bin, konnte ich nicht viel herausfinden. Bitte helfen Sie mir dabei.

Was soll ich tun, wenn ich die Worte zu extrahieren, wie es unten gezeigt wird: ich sollte „ein gutes Buch“ bekommen für die erste Instanz von

passende

Quelle

2016-06-15 Maddy

tun wir substring nach unlist die gregexpr ing verwenden können Ausgabe.

v1 <- unlist(gregexpr("oo", sentence)) 
substring(sentence, v1 - 5, v1 +5) 
#[1] "s a good bo" "ood book. G" "ok. Good fo" "his book ex" "ce. Good fo" "her books"

Quelle

2016-06-15 09:26:10 akrun

Vielen Dank! Es funktionierte einwandfrei – Maddy

Heyy für das oben erwähnte Problem akrun, wenn ich die zwei Wörter vor und nach dem Wort extrahieren möchte, das die Phrase enthält, was soll ich tun? Für ein Beispiel sollte ich "ein gutes Buch" für die erste Instanz des Abgleichs bekommen. – Maddy

@Maddy Es ist nicht so klar. Das erste Match wäre für "oo" gut. Es ist besser, als neue Frage zu posten. – akrun

Wenn Sie nicht Paket mit stringr nichts dagegen

library(stringr) 
ind<-str_locate_all(sentence,"oo")[[1]][ ,1] 
str_sub(sentence,ind-5,ind+5) 


[1] "s a good bo" "ood book. G" "ok. Good fo" "his book ex" "ce. Good fo" "her books"

Quelle

2016-06-15 09:19:45

Sie könnten auch

mapply(
    substr, 
    x=sentence, 
    start=pos[[1]]-5, 
    stop=pos[[1]]+5, 
    USE.NAMES = F 
) 
# [1] "s a good bo" "ood book. G" "ok. Good fo" 
# [4] "his book ex" "ce. Good fo" "her books"

Quelle

2016-06-15 09:24:47 lukeA

Vielen Dank allen für Ihre schnelle Antworten – Maddy

Heyy Lukea für das oben genannte Problem, wenn ich die beiden Wörter vor und nach dem extrahieren möchten Wort, das die Phrase enthält, was soll ich tun? Für ein Beispiel sollte ich "ein gutes Buch" für die erste Instanz des Matching bekommen. – Maddy

Sie sollten eine neue Frage stellen. – lukeA

pos = gregexpr("oo", sentence)

Passen Sie die Positionen und Längen:

pos[[1]] <- pmax(pos[[1]] - 5, 0) 
attr(pos[[1]], "match.length")[] <- 11 
regmatches(sentence, pos) 
#[[1]] 
#[1] "s a good bo" "ood book. G" "ok. Good fo" "his book ex" "ce. Good fo" "her books"

Quelle

2016-06-15 09:27:00 Roland

Extrahieren einer Zeichenfolge basierend auf Position gefunden Charakter in R

Antwort

Verwandte Themen