Um die Latent semantische Indexierung Methode von GENSIM zu verwenden, möchte ich wie mit einem kleinen „classique“ Beispiel beginnen:Latent Semantic Indexation mit GENSIM
import logging, gensim, bz2
id2word = gensim.corpora.Dictionary.load_from_text('wiki_en_wordids.txt')
mm = gensim.corpora.MmCorpus('wiki_en_tfidf.mm')
lsi = gensim.models.lsimodel.LsiModel(corpus=mm, id2word=id2word, num_topics=400)
etc..
Meine Frage ist: Wie das Corpus Iterator erhalten "wiki_de_tfidf.mm"? Muss ich es irgendwo herunterladen? Ich habe im Internet gesucht, habe aber nichts gefunden. Hilfe bitte ?