2009-03-25 12 views
3

Ich habe einen relativ einfachen Lucene-Index, der von Solr bedient wird. Der Index besteht aus zwei Hauptfeldern, Titel und Körper, und einigen weniger wichtigen Feldern.Empfohlene Titelbeschleunigung?

Die meisten Suchmaschinen geben mehr Relevanz für Ergebnisse mit Übereinstimmungen im Titel, über den Körper. Ich werde damit beginnen, dem Titelfeld einen Index-Zeit-Boost zu geben.

Meine Frage ist, welche Werte verwenden Menschen normalerweise für ihre Titelfelder? 2? 4? 10? 100?

+0

Warum Index Zeit Boost anstelle von Suchzeit verwenden? –

Antwort

3

Ich schlage vor, dass Sie die mittlere Körperlänge durch die mittlere Titellänge teilen. Dies gibt Ihnen ungefähr einen Faktor M - für M Erscheinungen eines Wortes im Körper wird es einmal im Titel erscheinen. Verwenden Sie jetzt etwas wie M * 3. Dies ist natürlich eine rationalisierte Heuristik, und es ist am besten, wenn Sie über die Werte iterieren. Eine viel strukturierte Diskussion finden Sie unter Grant Ingersoll's "Debugging Relevance Issues in Search".