2016-12-15 7 views
7

Ich benutze gensim word2vec Paket in Python. Ich möchte die Gewichtsmatrizen W und W' abrufen, die während des Überspringengrammlernens gelernt wurden.Erhalten Sie Gewichtsmatrizen von gensim word2Vec

Es scheint mir, model.syn0 gibt mir die erste, aber ich bin mir nicht sicher, wie ich die andere bekommen kann. Irgendeine Idee?

Ich würde wirklich lieben jede erschöpfende Dokumentation von Modellen zugänglich Attribute zu finden, weil die offizielle nicht genau zu sein scheint

+1

Ich habe es gerade mit einem kleinen Datensatz versucht und mir die gesamte Einbettungsmatrix 'np.shape (model.syn0)' gegeben –

Antwort

2

(zum Beispiel syn0 nicht als Attribut beschrieben wird) Die model.wv.syn0 enthält die Eingang Einbettung Matrix. Ausgang Einbettung wird in model.syn1 gespeichert, wenn es mit hierarchical softmax (hs=1) oder in model.syn1neg trainiert wird, wenn es negative Stichproben (negative>0) verwendet. Das ist es! Wenn sowohl das hierarchische Softmax- als auch das negative Sampling nicht aktiviert sind, verwendet Word2Vec eine einzige Gewichtsmatrix model.wv.syn0 für das Training.

Siehe auch eine verwandte Diskussion here.

Verwandte Themen