Ich bin mit tf-idf mit Kosinusähnlichkeit Beschreibung (Satz) ÄhnlichkeitTf-Idf mit Kosinusähnlichkeit für Dokumentenähnlichkeit fast ähnlichen Satz
Eingabezeichenfolge berechnen:
3/4x1/2x3/4 blk mi tee
Im Folgenden sind die Sätze
smith-cooper® 33rt1 reducing pipe tee 3/4 x 1/2 x 3/4 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 1 x 1/2 x 3/4 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 1-1/4 x 1 x 3/4 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 1-1/2 x 3/4 x 1-1/2 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 1-1/2 x 1-1/4 x 1 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 2 x 2 x 3/4 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 2 x 1-1/2 x 1-1/4 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 2-1/2 x 2 x 2 in npt 150 lb malleable iron black
smith-cooper® 33rt1 reducing pipe tee 3 x 3 x 2 in npt 150 lb malleable iron black
unter denen ich brauche Satz Eingabestring ähnlich zu finden, wie die Sätze fast ähnlich sind, ich TF-IDF Ansatz verwenden, die Worte geringe Punktzahl geben Diese erscheinen in allen Dokumenten (IDF) und geben den einzelnen Wörtern mehr Punkte, was es einfacher macht, das ähnliche Dokument zu finden.
Gibt es einen Ansatz, der besser funktioniert?