Wenn ich richtig verstehe, stempelt SynonymFilterFactory Synonyme in keiner Weise. Insofern müsste man mit Pluralformen und Zeitformen in ihrer Synonymdatei ziemlich erschöpfend sein, wenn sie ungeachtet der Pluralisierung/Spannung eine gute Erinnerung haben wollen.SOLR: SynonymFilterFactory mit stemming
Ich sehe, dass die SynonymFilterFactory hat ein optionales Argument, wo es einen Analysator akzeptieren kann.
Analysator: (optional; Standard: WhitespaceTokenizerFactory) Der Name der Analysatorklasse, die beim Analysieren der Synonymdatei verwendet werden soll. Wenn der Analysator angegeben wird, ist TokenizerFactory möglicherweise nicht vorhanden und umgekehrt.
Ich bezweifle, dass wie so den gewünschten Analysator nisten gilt:
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" >
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
</filter>
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
Ich vermute, dass eine Erweiterung Analysator Kompilieren .jar und es in SOLR lib Ordnern ablegen könnte der einzige Weg, dies zu tun. Gibt es eine Möglichkeit, einen benannten Analysator in der Konfiguration zu definieren, oder eine andere Methode, um dieses Ziel zu erreichen?