Ich habe in der Dokumentation gelesen, wie der Relevanzwert berechnet wird. Aber ich kann immer noch nicht verstehen, warum sie die inverse Dokumentenhäufigkeit berücksichtigt haben. Wie wirkt sich die inverse Dokumentenhäufigkeit auf die Relevanz eines Dokuments aus?Bedeutung der inverse Dokumentenhäufigkeit bei der Berechnung der Relevanz der elastischen Suche
Antwort
Grundsätzlich, wenn ein Begriff T sehr häufig ist (zB Stoppwörter, "und", "der", usw.) und in vielen Ihrer Dokumente zu finden sind, sind Sie wahrscheinlich nicht daran interessiert, alle Dokumente zu erhalten zurück und Sie möchten wahrscheinlich nicht, dass der Begriff T die Bewertung zu sehr beeinflusst.
Das ist die Aufgabe des IDF-Teils in der TF/IDF-Formel, was bedeutet, dass seltenere Begriffe einen höheren Beitrag zur Punktzahl liefern, weshalb der Begriff TF des Terms T in einem gegebenen Dokument mit dem IDF multipliziert wird dieser Begriff für den gesamten Dokumentenkorpus. Je mehr Dokumente einen gegebenen Begriff enthalten, desto weniger relevant/diskriminierend sollte dieser Begriff sein.
Ein Begriff "Elefant", der einige Male in einem Dokument D erscheint, aber nicht notwendigerweise in allen anderen Dokumenten, trägt dazu bei, Dokument D eine höhere Punktzahl zu geben als für alle anderen Dokumente.
Ein Begriff "und", der in fast allen Dokumenten erscheint, wird nicht viel zur Punktzahl beitragen, weil die IDF vernachlässigbar sein wird.
- 1. Verstehen der elastischen Suche
- 2. Boolesche Abfrage bei der elastischen Suche
- 3. Inverse Kinematics: Berechnung der Jacobi
- 4. Feldanalyse standardmäßig in der elastischen Suche deaktivieren
- 5. Prozent bei der Berechnung
- 6. Syntax für Funktionsscore in der elastischen Suche
- 7. Indizierung der Website/URL in der elastischen Suche
- 8. Wie Apache Solr die Position von Text bei der Berechnung der Relevanz Punktzahl ignorieren
- 9. Bedeutung der
- 10. Querystring Suche auf Array-Elemente in der elastischen Suche
- 11. Auf der Suche nach der Bedeutung von "selbst"
- 12. Wie Apache Solr die Größe von Dokumenten bei der Berechnung ihrer Relevanz Punktzahl ignorieren
- 13. Kombinieren fehlender Termfilter und Bereichsüberprüfung in der elastischen Suche
- 14. Inverse der 'Predict' Funktion
- 15. Problem bei der Array-Suche
- 16. Logische Fehler bei der Suche
- 17. Festlegen des Anforderungstimeouts in der elastischen Suche nach Massenlasten
- 18. Mehrere synonym_path für einzelne Index in der elastischen Suche implementieren
- 19. Wie aktualisiert man die verschachtelten Daten der elastischen Suche?
- 20. Verwenden von Filter neben Query_string in der elastischen Suche
- 21. Aggregation von Feldern in der elastischen Suche verwendet
- 22. Indexieren eines durch Kommas getrennten Wertfelds in der elastischen Suche
- 23. Wie werden Daten in der elastischen Suche physikalisch gespeichert?
- 24. Wie erzwinge gültige JSON in der elastischen Suche?
- 25. Ausführen einer Multi- "Match-Phrase" -Abfrage in der elastischen Suche
- 26. Wie wird geschachteltes Objekt in der elastischen Suche abgerufen?
- 27. JSON-Feld als String in der elastischen Suche speichern?
- 28. Verwendung von LINQ zum Verarbeiten von Ergebnissen der elastischen Suche
- 29. Wie indexiere ich hierarchische Daten in der elastischen Suche?
- 30. So erstellen Sie mehrere Knoten in der elastischen Suche
danke .. alles gelöscht. –
Super, froh, dass es geholfen hat. – Val