2017-09-11 4 views

Antwort

0

Die "Paragraph Vectors" -Algorithmen hinter Doc2Vec geben einfach Dokumente Vektoren, die in ihrer Entfernung/Richtungs-Anordnung im Vergleich zu anderen gemeinsam trainierten Dokumentenvektoren interessant sind.

Die einzelnen Dimensionen haben keine spezifischen interpretierbaren Bedeutungen. Wie bei Word2Vec kann es "Nachbarschaften" von verwandten Elementen geben, und bestimmte directions können vage auf verständliche Konzepte übertragen werden.

Aber diese Richtungen sind nicht direkt mit den einzelnen senkrechten Dimensionen des Koordinatenraums ausgerichtet. Und es gibt nichts, was Ihnen hilft, diese Richtungstendenzen zu beschreiben. (Sie neigen dazu, nach oben zu kommen, wenn Vektoren differenzier, wie sie in der Analogie der Lösung von Problemen.)

Sie können ein Beispiel in dem ‚Document Embedding With Paragraph Vectors‘ Papier, siehe Tabelle 2, wo japanischer Pop-Künstler, der (vielleicht) ähnlich zu ' Lady Gaga 'wird entdeckt, indem man sich im Raum in Richtung -'American'+'Japanese' bewegt. Das heißt, es gibt keine einzige Dimension, die japanisch gegen amerikanisch ist - aber es gibt eine Richtungsneigung über alle Dimensionen hinweg.

Verwandte Themen