Ich bin verpflichtet, Solr für meine poc verwenden und ich bin mit dem unten genannten Problem und nicht in der Lage, eine Lösung zu lösen.Indizierung Subwörter einer URL in Solr
Jede Hilfe würde sehr geschätzt werden. !!
Im Folgenden sind die vier Fälle i zu erreichen versuchen: URLs: 1.www.abc.com 2.www.abcdef.com 3.www.123.com/abc 4.www.123 .com/abcdef
Ich verwende Standard-Tokenizer zum Indexieren der URLs, die Wörter wie unten und Index teilt. 1.www.abc.com 2.www.abcdef.com 3.www.123.com und abc 4.www.123.com und abcdef
Wenn ich für abc suchen würde ich nur die 3. URL als Suchergebnis
Aber ich möchte alle vier URLs bekommen, wenn ich mit dem Schlüsselwort abc suche.
Kindy vorschlagen.
Danke.
Vielen Dank für Ihre antwort vinod. Ich denke, die Verwendung von NGram ist gut, wenn wir den Feldnamen von wenigen Zeichen haben und Token generieren. Aber in meinem Fall ist Feld eine URL, deren Länge sehr lang sein kann, und ich denke, in diesem Fall wird eine große Anzahl von Tokens erstellt. !! Was denkst du .. – user3257510
richtig, es generiert mehr Anzahl von Token. Daher werden sowohl die Indexgröße als auch die Indexierungszeit erhöht. Kein anderer Weg mit solr. – vinod