2016-07-07 5 views
0

Ich habe ein Problem mit meinem Solr-Core und der StandardTokenizerFactory. Ich muss Zahlenmaße erstellen, aber der StandardTokenizer erstellt die falschen Zahlen.Solr StandardTokenizer erstellt falsche Zahlen

z.B. Ich suche nach "Spanplattenschraube 4,5 50".

In meiner Solr Analyse Admin die Tokenizer daraus erzeugen die Zahlen "4.0", "4.5.0", "5", "50.0", "50"

, um ein erstes Ergebnis erhalte ich ein Dokument das enthält "spanplattenschraube 4,0" aber nicht "spanplattenschraube 4,5".

Wie kann ich verhindern, dass die StandardTokenizerFactory falsche Zahlen erzeugt oder gibt es eine bessere TokenizerFactory für mein Problem?

+0

Welche Tokens möchten Sie? – MatsLindh

Antwort

0

können Sie versuchen, eine einfache Token Fabrik zum Beispiel

solr.WhitespaceTokenizerFactory

Erzeugt org.apache.lucene.analysis.WhitespaceTokenizer zu verwenden.

Erstellt Token von Zeichen, die durch Aufteilen auf Whitespace getrennt wurden.

Bitte lesen Sie hier für weitere Informationen: https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.StandardTokenizerFactory

Wenn Sie mehr Logik implementieren müssen, wie Wörter zu spalten und usw. Sie verwenden können später

solr.WordDelimiterFilterFactory

Kombinationen von WhitespaceTokenizerFactory + WordDelimiterFilterFactory

Verwandte Themen