Ich führe gerade ein Thema Modellierung mit LDA aus text2vec
Paket. Ich schaffte es, eine dtm-Matrix zu erstellen und dann LDA
und seine fit_transform
Methode mit anzuwenden.text2vec - Werden die Wörter der Themen mit neuen Daten aktualisiert?
Während ich mir die obersten Wörter von jedem Thema ansah, kam mir eine Frage in den Sinn. Ich plane, das Modell später auf neue Daten anzuwenden, und es besteht die Möglichkeit, dass neue Wörter vorkommen, die dem Modell vorher nicht begegnet sind. Wird das Modell immer noch in der Lage sein, jedes Wort seinem jeweiligen Thema zuzuordnen? Werden diese Wörter außerdem zum Thema hinzugefügt, sodass ich sie mit get_top_words
finden kann?
Vielen Dank für Ihre Antwort!