0
ich Textanalyse tun tidytext
verwenden. Ich versuche das tf-idf für ein Korpus zu berechnen. Der üblicher Weg, dies zu tun ist:Erste tf idf, wenn Dokumente von zwei Spalten definiert sind
book_words <- book_words %>%
bind_tf_idf(word, book, n)
aber in meinem Fall, das ‚Dokument‘ wird nicht von einer einzigen Spalte definiert (wie book
). Ist es möglich, nennen bind_tf_idf, wo das Dokument von zwei Spalten definiert ist (zum Beispiel book
und chapter
)?
nicht sicher, ob ich verstehen. Können Sie nicht einfach die beiden Spalten miteinander verbinden, um eine Spalte Text zu erhalten? Etwas wie: cbind (Buch, Kapitel) – triddle