2016-04-28 6 views
1

Ich frage mich, ob Sie Word2vec Umsetzung kennen, die berücksichtigt, dass Auto und Autos fast das gleiche Konzept darstellt, oder lehrer und lehrerin (Deutsch für männliche bzw. weibliche Lehrer) sind fast das gleiche. Die Implementierungen, die ich gesehen habe, ignorieren diese Tatsache weitgehend, und daher ist die Qualität der Ergebnisse schlecht.word2vec Implementierung addressing männlich/weiblich und Singular/Plural Ausgaben

Vielen Dank im Voraus.

Antwort

1

Im letzten Jahr haben einige Forschungsgruppen begonnen, die Zeichenfolge eines Wortes zu verwenden, um Worteinbettungsvektoren zu generieren. Sehen Sie dieses Papier "Finding Function in Form: Compositional Character Models for Open Vocabulary Word Representation" für ein Beispiel. Es gibt auch eine frühere Arbeit "Compositional Morphology for Word Representations and Language Modelling", die Modelle morphologische Unterschiede wie Unterschiede zwischen Singular- und Pluralform verwendet.

Mir sind keine Open-Source-Implementierungen dieser Typen von Modellen bekannt.