Ich habe X als csr_matrix, die ich erhielt scikit des TFIDF vectorizer verwenden und y, die ein Array istWie initialisieren Sie eine Gensim-Corpus-Variable mit einer csr_matrix?
Mein Plan Features LDA zu erstellen ist verwenden, scheiterte aber ich zu finden, wie ein GENSIM des corpus Variable zu initialisieren, mit X als csr_matrix. Mit anderen Worten, ich möchte kein Korpus herunterladen, wie es in Gensims Dokumentation gezeigt wird, oder X in eine dichte Matrix konvertieren, da es viel Speicher verbrauchen würde und der Computer hängen könnte.
Kurz gesagt, sind meine Fragen die folgende,
- Wie initialisieren Sie einen GENSIM corpus gegeben, dass ich eine csr_matrix (spärlich), die den gesamten Korpus?
- Wie verwenden Sie LDA zum Extrahieren von Features?
Können wir die Häufigkeitsmatrix auch an diese Methode übergeben? – Shashank