Ich benutze Gensim-Version 0.12.4
und habe zwei separate Worteinbettungen mit dem gleichen Text und den gleichen Parametern trainiert. Nach dem Training berechne ich die Pearsons-Korrelation zwischen Wortauftrittshäufigkeit und Vektorlänge. Ein Modell, das ich unter Verwendung save_word2vec_format(fname, binary=True)
trainierte und dann unter Verwendung load_word2vec_format
der anderen geladen wurde, die ich unter Verwendung model.save(fname)
trainierte und dann geladen wurde, Word2Vec.load()
verwendend. Ich verstehe, dass der word2vec-Algorithmus nicht deterministisch ist, so dass die Ergebnisse variieren werden, aber der Unterschied in der Korrelation zwischen den beiden Modellen ist ziemlich drastisch. Welche Methode sollte ich in diesem Fall verwenden?Gensim save_word2vec_format() vs. model.save()
0
A
Antwort
0
EDIT: Dies war als Kommentar gedacht. Ich weiß nicht, wie ich es jetzt ändern kann, tut mir leid
Korrelation zwischen dem Wort Häufigkeit-Auftreten und Vektor-Länge ich nicht ganz folgen - sind nicht alle Ihre Vektoren die gleiche Länge? Oder beziehen Sie sich nicht auf die Einbettungsvektoren?
Verwandte Themen
- 1. Speichere Gensim Word2vec Modell im Binärformat .bin mit save_word2vec_format
- 2. ExtJS 4.1 - Store.add() (gefolgt von sync) vs Model.save()
- 3. Gensim Segmentierung Fehler
- 4. Djangos Model.save() modifiziert unerwünschte Spalten
- 5. GENSIM Installationsprobleme
- 6. Backbone.js - model.save() feuert keine PUT Anfrage
- 7. Warum ruft djangos model.save() full_clean() nicht auf?
- 8. GENSIM: custom Ähnlichkeitsmaß
- 9. GENSIM word2vec Online-Training
- 10. Gensim Wörterbuch Implementierung
- 11. Thema Modellierung mit Gensim
- 12. Gensim LDA Thema Zuordnung
- 13. Probleme beim Zugriff auf docvectors mit gensim
- 14. GENSIM doc2vec Dokumente nicht von id
- 15. gensim word2vec gibt inkonsistente Ergebnisse
- 16. GENSIM und Unicode in Python
- 17. Gensim finde Themen in Sätzen
- 18. Entfernen von Dokumenten in Gensim
- 19. was ist ('/ tmp/text8') GENSIM
- 20. Backbone model.save() ID nicht an Ende der URL anhängen
- 21. Django Rest Framework - Wie man Kwargs an model.save() übergeben?
- 22. in ExtJS, ist es besser, Model.save() oder Store.Sync() aufzurufen?
- 23. Backbone model.save() wird bei Versand statt POST PUT
- 24. Kann ich model.save() bekommen, um einen Rückgabewert zu haben?
- 25. Gensim gespeichert Wörterbuch hat keine ID2token
- 26. Versuch Deepdict, laufen GENSIM word2vec mit pyspark
- 27. Erhalten Sie Gewichtsmatrizen von gensim word2Vec
- 28. Chunkize Warnung bei der Installation GENSIM
- 29. Versuchen, Scikit Ngram mit Gensim zu imitieren
- 30. Zusammenfassen von zwei Gensim Phrases Modellen
Entschuldigung dafür, dass ich nicht klar bin - ich verwende die Größe der Einbettungsvektoren. I.e. '' numpy.linalg.norm (Modell [Wort]) '' – GNMO11