Ich arbeite mit Textdaten von Abstracts und versuche stm
(strukturelle Themenmodellierung) zu verwenden, um unbeaufsichtigte extrahierte Themen vor dem Konstruieren zu betrachten mein eigenes Wörterbuch (für die überwachte Analyse). Ich habe mit einem Problem zu tun und frage mich, ob jemand schon einmal auf das gleiche Problem gestoßen ist. Wenn findThoughts()
laufen bekomme ich folgende Fehlermeldung:R stm - Anzahl der bereitgestellten Texte und Anzahl der modellierten Dokumente stimmen nicht überein
Error in findThoughts(out.stm, topics = 27, texts = corpus$documents$texts, : Number of provided texts and number of documents modeled do not match
Ich bin nicht sicher, was mit meinen Daten falsch ist. Ich dachte, es könnte mit NA
Werten in diesen leeren Zeilen des Korpus zu tun hat, wobei ich keine abstraktes hatte, aber das gleiche passiert, nachdem NA
Reihen zu entfernen (mit dem folgenden:
df[!is.na(df$abstract),]
Wenn Sie eine Idee haben, auf der Materie, lass es mich wissen.