Ich brauche Hilfe beim Schreiben eines Programms basierend auf dem Code aus diesen Links link1 und link2, die automatisch die semantische Ähnlichkeit zwischen a berechnen wird. Aufeinanderfolgende Sätze und b. Sätze trennen sich durch 1 dazwischenliegenden Satz, im gesamten Dokument (1000 Sätze).Semantische Kohärenz zwischen Sätzen in einem Text finden
Der angegebene Code tokenisiert bereits und kann semantische Ähnlichkeit finden, aber ich habe keine Ahnung, wie ich den neuen Code schreibe, der die semantische Ähnlichkeit zwischen aufeinander folgenden und "dazwischenliegenden" Sätzen über den ganzen Text berechnet (und anzeigt) (a, b). Ich möchte nicht immer wieder dasselbe machen.
Haben Sie sich [word2vec] (http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf) ([ oder das] (https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-vectors/)) überhaupt? Ich habe seine Python-Implementierung für etwas ähnliches in der Vergangenheit verwendet. – Fruitspunchsamurai
Hallo, diese Artikel sind meist Theorie, die ich verstehe, habe ich Probleme mit der Anwendung der Ideen in Code und die Automatisierung des Prozesses. –
Was hast du bisher versucht? Ich stelle mir vor, Sie hätten ein Programm, das Dateien zeilenweise liest und sie mit der nächsten Zeile/benachbarten Phrase vergleicht? – Fruitspunchsamurai