Ich berechnete tf/idf Werte von zwei Dokumenten. Im Folgenden sind die tf/idf Werte: 1.txt
0.0
0.5
2.txt
0.0
0.5
Die Dokumente sind wie: 1.txt = > dog cat
2.txt = > cat elephant
Wie kann ich
Ich möchte den Begriff Häufigkeit mit tf-IDF berechnen. Ich habe eine Gleichung entworfen, in der du den tf-idf-Wert auf der linken Seite bekommen solltest. Ist das richtig? TF-IDF für DOCUMENT: tf-id
Ich habe einen Index in Lucene gebaut. Ich möchte, ohne eine Abfrage anzugeben, nur um eine Punktzahl (Kosinusähnlichkeit oder eine andere Entfernung?) Zwischen zwei Dokumenten im Index zu erhalten. Z