Ich möchte Word-Einbettungen für Dokumente mit GloVe erstellen. Ich weiß, wie man Vektoreinbettungen für einzelne Wörter (Unigramme) wie folgt erhält (für ihr Beispieltextdokument).N-Gramm in Glove
$ git clone http://github.com/stanfordnlp/glove
$ cd glove && make
$ ./demo.sh
Jetzt möchte ich Vektoreinbettungen für Bigramme erhalten. Beispielsweise;
- "New York" -> statt "Neu" und "york"
- "Maschinelles Lernen" -> anstelle von "Maschine" und "Lernen"
Ist es möglich, in Glove machen? Wenn ja, wie?
Verwenden Sie die * Quelle *. –
Beachten Sie, dass Einbettungen für Wortkombinationen, die von Einbettungen für einzelne Wörter ausgehen, definitiv nicht-trivial und ein fortlaufendes Forschungsthema sind. – gented