2010-12-08 19 views
0

Wie berechne ich die Kosinusähnlichkeit Entfernung von zwei Dokumenten in Perl? Ein paar Fragen: 1) Gibt es bereits Module zur Berechnung der Kosinusähnlichkeitsabstände in CPAN? Oder ist diese Aufgabe einfach genug, um zu kodieren? 2) Wenn ich Dokumente sage, meine ich wirklich, dass ein "Dokument" ein Satz ist und das andere "Dokument" nur eine Liste von Schlüsselwörtern. Um fair zu sein, sollte ich alle Schlüsselwörter in jedem Dokument vor der Berechnung der Cosinusähnlichkeitsabstände in Token zerlegen, sortieren und sortieren?Computing Cosinus Ähnlichkeit in Perl

+1

ist dies eine Hausaufgabe? –

Antwort