2017-10-12 4 views
0

Ich benutze die gensim library for word2vec. Ich möchte das Modell anhand von Textbeispielen, die nichts miteinander zu tun haben, trainieren: "Die Katze ist braun. Wie spät ist es?"Gensim mit verschiedenen Kontext

Ich habe die folgende Eingabe in das Modell erstellt:

[["The", "cat", "is", "brown"], ["What", "time", "is", "it"]], aber ich frage mich, ob das Modell geht davon aus, dass „braun“ und „Was“ im gleichen Kontext ist.

Versucht, die Antwort in der API zu finden, konnte es aber nicht finden.

Antwort

0

Die Gensim-API wird im selben Kontext nicht "braun" und "was" berücksichtigen. Ungleiche Fenster werden in der Nähe von Satzgrenzen verwendet. Also, für Ihr Beispiel, wenn die Fenstergröße sagen wir mal 1, die (Kontext, Ziel) Paare wie wie folgt aussehen würde:

([cat],The), ([The,is],cat), ([cat,brown],is), ([is],brown) ([time],What), ([What,is],time), ([time,it],is), ([is],it)

Ich hoffe, dass dies Ihr Zweifel löscht.