Ich habe eine Zeichenfolge:R konvertieren String tokenize mit „Vektor“
string1 <- "This is my string"
Ich möchte es auf einen Vektor konvertieren, die wie folgt aussieht:
vector1
"This"
"is"
"my"
"string"
Wie kann ich das tun ? Ich weiß, dass ich das tm
Paket verwenden könnte, um zu termDocumentMatrix
umzuwandeln und dann zu einer Matrix zu konvertieren, aber es würde die Wörter alphabetisch ordnen und ich brauche sie, um in der gleichen Reihenfolge zu bleiben.
Deron bietet eine gute Lösung, aber wenn Ihr Text komplizierter ist als das (zB Interpunktion usw.), benötigen Sie ein wenig mehr Ansatz. –
möglich duplizieren: http://stackoverflow.com/questions/520810/does-r-have-quote-like-operators-like-perls-qw – GSee
GSee das ist etwas anderes gefragt. screechOwl möchte einen einzelnen Zeichenvektor in Wörter aufteilen, wobei der von Ihnen angegebene Link anzeigt, dass das Poster nicht in Anführungszeichen gesetzte Wörter eingeben soll, die in Zeichen umgewandelt werden. –