Ich mache SMS Kategorisierungsmodul. Dazu möchte ich meine Nachrichten in verschiedene Themen einteilen. Also möchte ich Gensim dafür benutzen. Kann mir jemand die Quelle eines Tutorials zur Verfügung stellen, das mir helfen kann, die Themenmodellierung mit Gensim zu beginnen?Thema Modellierung mit Gensim
Antwort
Radim Řehůřek, der Autor von GENSIM, Tutorials auf seiner Website zur Verfügung, die ich sehr hilfreich: https://radimrehurek.com/gensim/tutorial.html
Er bietet auch einige Tutorials auf seinen Github, die nicht so leicht zu finden sind, so für eine Weile graben dort könnten einige großartige Notizbücher an die Oberfläche kommen. Zum Beispiel dieser zwei (für LDA): https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/lda_training_tips.ipynb
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/topic_methods.ipynb
ich es sehr spannend mit der englischen Wikipedia zu beginnen persönlich gefunden, für die Řehůřek bietet auch ein Tutorial. Obwohl es sehr lange dauert, das Modell zu trainieren, werden Sie mit sehr "natürlich" scheinenden Themen konfrontiert, die es leicht machen, die Funktionalität von Gensim zu testen.
- 1. Gensim LDA Thema Zuordnung
- 2. LDA Thema Modellierung Eingabedaten
- 3. GENSIM - LDA erstellen document- Thema Matrix
- 4. Thema Modellierung mit bereits bestehenden Themen
- 5. Doc2Vec Gensim Ähnlichkeit zwischen Dokument und Thema
- 6. Thema Modellierung in R mit Phrasen, anstatt einzelne Wörter
- 7. Extrahieren Sie Thema Wort Wahrscheinlichkeitsmatrix in Gensim LdaModel
- 8. GENSIM erhalten Thema für ein Dokument (gesehen Dokument)
- 9. Modellierung: Effiziente Modellierung der Subsetauswahl
- 10. Modellierung mit Scala-Fallklasse
- 11. GENSIM: Wie Modell vorherigen word2vec Modell
- 12. GENSIM Installationsprobleme
- 13. Gensim finde Themen in Sätzen
- 14. Thema Modellierung - Zuweisen eines Dokuments mit Top 2 Themen als Kategoriebezeichnung - sklearn Latente Dirichlet-Zuweisung
- 15. Thread-Modellierung
- 16. Modellierung (deterministisch) Trend mit Nnetar
- 17. GENSIM: custom Ähnlichkeitsmaß
- 18. Was ist kontextabhängige akustische Modellierung?
- 19. Gensim save_word2vec_format() vs. model.save()
- 20. Wie wird die vollständige Verteilung von Wörtern in einem LDA-Thema in Gensim ausgedruckt?
- 21. GENSIM word2vec Online-Training
- 22. Gensim Segmentierung Fehler
- 23. Gensim Wörterbuch Implementierung
- 24. Versuch Deepdict, laufen GENSIM word2vec mit pyspark
- 25. Versuchen, Scikit Ngram mit Gensim zu imitieren
- 26. Probleme beim Zugriff auf docvectors mit gensim
- 27. Verschiedene Modelle mit Gensim Word2Vec auf Python
- 28. String-Version des Dokuments nach ID in Gensim abrufen
- 29. Wie viel Zeit für ein Thema Modellierung über MALLET auf 9GB Korpus
- 30. Ontologie Modellierung und Befragung