Ich versuche, Benutzer-Benutzer-Ähnlichkeiten durch Kosinusähnlichkeit zu berechnen, indem ich zwei verschiedene Datensätze benutze (Benutzer sind die gleichen, die Merkmale, die zum Erhalten von Ähnlichkeiten in Betracht gezogen werden, unterscheiden sich zwischen den Datensätzen). Kann ich nun sagen, wie ähnlich diese beiden Datensätze auf den Ähnlichkeitswerten basieren?Wie kann ich zwei Ähnlichkeiten vergleichen, die mit zwei verschiedenen Datensätzen erzielt wurden?
Wie kann ich zwei Ähnlichkeiten vergleichen, die mit zwei verschiedenen Datensätzen erzielt wurden?
Antwort
Ich denke, die Antwort hier sollte nein sein, es sei denn, es gibt keine gemeinsamen Merkmale in den beiden Datensätzen (wenn sie nur in Einheiten unterscheiden, können Sie sie beide normalisieren und verwenden). Beispielsweise können Sie einem Benutzer keine Filme empfehlen, die zwei verschiedene Datensätze verwenden, wobei einer nur das Alter und Geschlecht der Benutzer enthält, während der andere nur die Lieblingsgenres, die die Benutzer mögen, enthält, und die beiden Ergebnisse vergleicht.
Ihr Abfragevektor sollte außerdem dieselben Features wie der Datensatz aufweisen, den der Ähnlichkeitssuchalgorithmus verwendet.
In Ihrem Fall, wenn die Abfrage Funktionen der beiden Datensätze hat, können Sie die k Nearest Neighbors in beiden (z. B.) finden und sie beide, d. H. 2k Ergebnisse zurückgeben. Aber Sie können nicht zwischen den zwei Paaren von k NNs wählen, bezüglich dessen, was am besten ist. Ich würde auch empfehlen, einen Weg zu finden, die beiden Datensätze zusammenzuführen, anstatt diesem Ansatz zu folgen.
Edit: Ich fehlinterpretierte die Frage. Wenn Sie in beiden Datensätzen dieselben Benutzer haben, sollten Sie sie zusammenführen (vorzugsweise mit der Spalte "Benutzer-ID", falls vorhanden) und dann den neuen Datensatz verwenden, um die Ähnlichkeit zwischen Benutzern zu berechnen.
Ihre Frage nach der Ähnlichkeit von Datensätzen macht in diesem Zusammenhang wenig Sinn.
- 1. Vergleichen von zwei Datensätzen
- 2. Wie kann ich zwei Arrays vergleichen?
- 3. Wie kann ich die Schnittmenge von zwei verrauschten Datensätzen finden?
- 4. Vergleichen von zwei Arrays
- 5. Kann ich mit openCV zwei Gesichter auf zwei verschiedenen Bildern vergleichen?
- 6. Wie kann ich zwei Tabellendaten vergleichen?
- 7. Wie kann ich zwei AssemblyName-Instanzen vergleichen?
- 8. Wie kann ich zwei gemischte Strings vergleichen?
- 9. Wie kann ich zwei Git-Repositories vergleichen?
- 10. Wie kann ich zwei String-Variablen vergleichen?
- 11. Wie kann ich zwei Lambda-Ausdrücke vergleichen?
- 12. Wie kann ich zwei Textdateien vergleichen?
- 13. Daten vergleichen zwischen zwei verschiedenen SQL-Servern
- 14. Jquery vergleichen zwei String aus verschiedenen Elementen
- 15. Vergleichen Anfragen von zwei verschiedenen Datenbanksystemen
- 16. Vergleichen von zwei Datensätzen mit Schnittpunkt in Python
- 17. Wie findet Git rerere die Ähnlichkeiten zwischen zwei Konflikten?
- 18. Wie habe ich zwei separate Zellen mit zwei verschiedenen Höhen?
- 19. Vergleichen von Elementen aus zwei verschiedenen Listen
- 20. Wie kann ich zwei Regale in TFS einfach vergleichen/vergleichen?
- 21. Wie zwei Spalten vergleichen in Excel (mit wenig verschiedenen Kriterien)
- 22. Wie zwei nsarrays mit verschiedenen Werten zu vergleichen?
- 23. Vergleichen Sie zwei Datumskomponenten aus verschiedenen Kalendern
- 24. Wie kann ich zwei PropertyInfos oder Methoden zuverlässig vergleichen?
- 25. Wie kann ich zwei Werte mit dem TextWatcher vergleichen
- 26. Wie kann ich zwei Dateien mit vollem Kontext vergleichen?
- 27. Wie vergleichen zwei Arbeitsmappe
- 28. Wie kann ich die Suche in zwei verschiedenen Verzeichnissen bestätigen?
- 29. Wie kann ich zwei verschiedenen TextViews die gleiche Hintergrundfarbe zuweisen?
- 30. Wie kann ich zwei Eigenschaften mit numerischen Werten vergleichen?