2016-06-14 5 views
-4

Ich habe einen Datensatz von 4.500 langen Texten, die ich mit R-Paketen analysiere. Ich möchte nur Sätze analysieren, die bestimmte Wörter enthalten, wie kann ich das tun? und kann ich R einen zweiten Satz aller Sätze erstellen dankWie kann ich nur bestimmte Sätze in R analzieren?

Antwort

0

Daten (die unabhängig von der ursprünglichen kompensiert werden?):

lorem <- "\nLorem ipsum dolor sit amet, consectetur adipisicing elit,\nsed do eiusmod tempor incididunt ut labore et dolore magna aliqua.\nUt enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi\nut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit\nin voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur\nsint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit\nanim id est laborum.\n\nSed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque\nlaudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi\narchitecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas\nsit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione\nvoluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet,\nconsectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et\ndolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis nostrum\nexercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi\nconsequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam\nnihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?\n" 

schreibt es als eine einzelne Textdatei „lorem_ipsum. txt“

cat(lorem, file="lorem_ipsum.txt") 
lorem <- readLines("lorem_ipsum.txt") 

nur Linien zurückzukehren, die das Wort "lit"

output<-grep("lit", lorem, value=T) 
output 

[1] "Lorem ipsum dolor sit amet, consectetur adipisicing elit,"         
[2] "in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur"     
[3] "sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit"   
[4] "consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et" 
[5] "consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam" 

Löschen Sie die Datei "lorem_ipsum.txt"

unlink("lorem_ipsum.txt") 
Verwandte Themen