Warum Word2vec übertrifft als andere neuronale Netzwerkmethoden?Warum Word2vec übertrifft als andere neuronale Netzwerkmethoden?
Word2vec ist flacher als andere neuronale Netzwerkmethoden (NNLM, RNNLM, etc.).
Es kann nicht erklärt werden?
Und ich möchte wissen, ob es irgendwelche negativen Auswirkungen auf das Modell ohne versteckte Schicht (Aktivierungsfunktion wie Sigmoid, etc.) hat?
Wie vergleichen Sie sie (welches Maß)? –
durch Genauigkeit messen? (In der 2013a Word2vec Papier) –
Sie denken, dass wir alle wissen, dass Papier, die Ergebnisse und die Methoden, die Sie anführen? Es ändert sich alle 6 Monate (oder noch schneller), 2013 ist ein bisschen alt. Ich finde 5 Artikel, die word2vec zu verschiedenen Metriken mit verschiedenen Sprachmodellen schlagen. Sie alle sagen, dass sie die Besten sind. Wenn Sie diese Art von Fragen haben, nennen Sie Ihre Quellen und erklären Sie besser den Kontext Ihrer Frage :) –