2012-04-10 4 views
0

Ich mache eine Recherche über PMI mit einem Motor, der von Solr. Ich möchte die Anzahl der Keywords innerhalb des Korpus (nicht die Anzahl der Docs) erhalten. Gibt es einen direkten Weg, um das zu bekommen? Noch eine Frage: Kann ich eine Suche durchführen, die einen Logikoperator (wie NEAR) im solr-System enthält? ODER ähnliche Methode, dies zu tun?solr: wie bekomme ich die Anzahl der Keywords im ganzen Korpus?

+0

Was meinen Sie, "die Anzahl der Schlüsselwörter innerhalb des Korpus"? Kannst du das bitte klären? Meinst du die Anzahl der passenden Keywords für ein bestimmtes Dokument? oder die Anzahl der übereinstimmenden Keywords in allen zurückgegebenen Dokumenten? oder die Gesamtzahl der Keywords in übereinstimmenden Dokumenten? –

+0

Ich meine die Anzahl der übereinstimmenden Schlüsselwörter in allen Dokumenten. – wensir

+0

Ah, wenn ein Dokument übereinstimmt, möchten Sie wissen, wie viele Wörter im Dokument mit der Suche übereinstimmten? und dann dasselbe für jedes Dokument, das übereinstimmt? Ich kenne keine direkte Methode dafür. Was Sie versuchen könnten, ist das Markieren mit '& hl.fragsize = 0' (gibt das gesamte Dokument zurück!) Und dann die Analyse der zurückgegebenen Daten (Anzahl der Wortgrenzen innerhalb der Highlight-Tags wird addiert, 1 wird hinzugefügt). –

Antwort

2

NEAR ist "Nähe-Suche"; solr bietet etwas ähnliches in Form von „sloppy phrase queries“, die die Form haben:

field:"phrase of words"~10 

Die 10 ist, wie nahe die Wörter im Satz sein muss.

+0

Vielen Dank! – wensir

Verwandte Themen