Wie finde ich die Anzahl der Vorkommen einer Liste von Wörtern? Ich kann für ein Wort suchen, wie folgt:Wie suche ich die Anzahl der Vorkommen einzelner Wörter in Textdaten?
dplyr::filter(data, grepl("apple", data$content,ignore.case = TRUE))
length(x$content)
Der |
Separator ermöglicht es mir, alle Vorkommen zusammenzufassen. Aber ich möchte jedes Wort einzeln zählen.
Die Worte könnte als eine Reihe in einer CSV oder geschrieben als ein Vektor in R selbst, beispielsweise geliefert werden:
words <- c("apple","orange","pear","pineapple")
Ein Falten ist, dass die data$count
eine Spalte von tweets sind so kann das Wort mehr auftreten als einmal pro Tweet. Daher möchte ich nur zählen, wenn sie in der Reihe auftreten.
Siehe 'stringr :: str_count' – www