2017-07-19 2 views
1

In Word2vec gibt es 3 Ebenen: Eingabe, ausgeblendet und Ausgabeschicht.Anzahl der Einheiten in der Ausgabeschicht von Hierarchical Softmax

Wenn wir den traditionellen softmax-Ansatz für einen Korpus der Größe V verwenden, ist die Anzahl der Einheiten der Ausgabeschicht auch V (Ein-Hot-Vektor-Eingabe).

Wenn wir Hierarchical Softmax verwenden, der Artikel sagt, dass es nur V-1 Knoten (im Huffman-Binärbaum) gibt. Bedeutet es, dass in der Ausgabeschicht nur V-1 Einheiten enthalten sind? Hier

ist die Referenz ich bin Lesung: https://arxiv.org/pdf/1411.2738.pdf

Thank you very much.

Antwort

1

In der Praxis erstellen Word2vec hierarchisch-softmax Implementierungen eine Ausgabeschicht mit genau so vielen Knoten wie Vokabeln. Siehe zum Beispiel in der ursprünglichen Google word2vec.c Linie:

https://github.com/tmikolov/word2vec/blob/20c129af10659f7c50e86e3be406df663beff438/word2vec.c#L356

Oder in der GENSIM Python-Implementierung Linie:

https://github.com/RaRe-Technologies/gensim/blob/f3bf792ee1344ed17ad2836ab3c38b4210f59889/gensim/models/word2vec.py#L1171

Sie können dann sehen, wie Worte einzelne Huffman-Codes zugeordnet sind, und Knoten ("Punkte") in der Ausgabeschicht in den Funktionen CreateBinaryTree (C) oder create_binary_tree.

+1

aber in der Seite [CreateBinaryTree] (https://github.com/tmikolov/word2vec/blob/20c129af10659f7c50e86e3be406df663beff438/word2vec.c#L218), Anzahl der Knoten = V-1, die nicht mit der Nummer identisch ist von Vokabeln? –

+0

Ah, ja, du hast Recht. Sowohl die ursprüngliche Implementierung von word2vec.c als auch die von Gensim haben ein Array voller Länge des Vokabulars für die HS-Output-Gewichte zugewiesen ... aber nicht den letzten Slot. So, es scheint, die Antwort auf Ihre Frage kann sein, "ja, es gibt V-1 aktive Knoten, aber eine mehr ist zugeteilt und ungenutzt". Sie können versuchen, den vorhandenen Code zu ändern, um eine weniger zuzuordnen, und sehen, ob etwas kaputt ist, um diese Interpretation zu bestätigen. – gojomo

+0

Ich stimme dir zu. Danke für deine großartige Hilfe! : P –

Verwandte Themen