2017-08-31 4 views
0

Gibt es eine Methode, ein Feld zu indizieren, so dass jeder Teilstring, der ein Wort enthält, als separate Tokens behandelt werden würde?Solr Tokenizer Filter Teilzeichenfolge

Zum Beispiel, Eingabe: "Hallo Welt, wie geht es dir?"

Ausgabe: „Hallo Welt, wie Sie sind“, „Hallo Welt, wie ist“, „Hallo Welt, wie“, „Hallo Welt“, „Hallo“

Dies in Kombination von SuggestComponent verwendet werden würde, zur Verfügung zu stellen Autosuggestion für Benutzer.

Antwort

0

Im Prinzip könnte etwas wie solr.ShingleFilterFactory den Trick für Sie tun. Es verfügt über 2 params: minShingleSize und maxShingleSize, so wird es für Sie eine Menge von Token generieren und einige von ihnen könnten nicht für Sie nützlich sein (auch eine Menge verschwendeten Speicherplatz auf der Festplatte für Sie bedeuten wird)

Möglicherweise müssen Sie entweder nicht benötigte Tokens herausfiltern oder möglicherweise Ihren eigenen Filter schreiben.