Ich versuche, die Ähnlichkeit zwischen 2 Sätzen zu berechnen, so habe ich 2 Satz von Wörtern, jeder stellt einen Satz und eine Funktion (F), die zwei Wörter erhält und die Ähnlichkeit zwischen ihnen zurück ein Weg .. Messen Ähnlichkeit zwischen 2 Vektoren
In Bild 1 sind die schwarzen Kreise die Worte des Satzes A sind, und die roten Quadrate repräsentieren Satz B. Für jede Zeitfunktion (F) 2 Wörter empfängt, gibt sie einen Wert zwischen 0,0 und 1.0, zum Beispiel: das erste Wort in A und das dritte Wort von B haben eine Ähnlichkeit von 0,3. Ich habe M x N Vergleich verwendet, weil die Reihenfolge der beiden Sätze oft nicht gleich ist, und auch die Anzahl der Wörter.
Meine Fragen sind:
alle M x N Vergleichsergebnisse Nachdem sie, wie könnte ich eine endgültige Punktzahl zwischen 0,0 und 1,0 erhalten, die die Ähnlichkeit der beiden Sätze oder Listen bezeichnet? "da die Länge der beiden Sätze nicht immer gleich ist".
Wenn dieser Ansatz nicht richtig ist, was ist die Alternative?
Interessant. Wie haben Sie Ähnliches definiert? –
Ich denke nicht, es ist genau klar, was Sie versuchen zu tun. Haben Sie eine Matrix von Ähnlichkeitswerten? Ich bin mir nicht sicher, was M x N Vergleich bedeuten soll. Ist die Frage zu einem Thema "Ähnlichkeit" oder Mathematik? Vielleicht können Menschen, die noch keine Erfahrung mit "Ähnlichkeit" haben, Hilfe leisten. –
@NickZiebert, semantisch mit kürzesten Weg in einer Ontologie. –