Ich versuche strukturelle Topic-Modelle (mit stm
Paket) auf der Dokument-Term-Matrix, die mit tm
Paket vorbereitet wurde.STM: wie Metadaten bei der Konvertierung von tm zu stm Dokument-Term-Matrix zu halten?
ich einen Korpus in tm
Paket gebaut, das die folgenden Metadaten enthält:
library(tm)
myReader2 <- readTabular(mapping=list(content="text", id="id", sentiment = "sentiment"))
text_corpus2 <- VCorpus(DataframeSource(bin_stm_df), readerControl = list(reader = myReader2))
meta(text_corpus2[[1]])
id : 11
sentiment: negative
language : en
Nach einiger Text-Reinigung zu tun und die Ergebnisse als clean_corpus2
(Metadaten noch vorhanden) zu speichern, ich es ändere Zeit dokumentieren Matrix und dann lesen sie es als stm
-kompatible Matrix:
library(stm)
chat_DTM2 <- DocumentTermMatrix(clean_corpus2, control = list(wordLengths = c(3, Inf)))
DTM2 <- removeSparseTerms(chat_DTM2 , 0.990)
DTM_st <-readCorpus(DTM2, type = "slam")
so weit, so gut. Allerdings, wenn ich versuchen, die Verwendung von Metadaten stm
-kompatible Daten angeben, werden die Metadaten gegangen:
docsTM <- DTM_st$documents # works fine
vocabTM <- DTM_st$vocab # works fine
metaTM <- DTM_st$meta # returns NULL
> metaTM
NULL
Wie halte ich die Metadaten aus tm
-Generated Corpus in stm
-kompatible Dokument-Begriff-Matrix? Irgendwelche Vorschläge willkommen, danke.
hallo, ich, dass am Ende herausgefunden, aber danke für hier die große Antwort veröffentlichen! –