Ich habe ein Problem mit Striping Interpunktion aus dem Solr-Index Wenn das Satzzeichen direkt nach einem Wort folgen, dann wird dieses Wort nicht richtig indiziert.Solr: Streifen Interpunktion vor dem Index
Zum Beispiel: Wenn wir "Hallo, John" indexieren, wird das Asset nicht mit dem Schlüsselwort "Hallo" gefunden, während es kein Problem gibt, wenn wir das Komma nach dem Wort "Hallo" entfernen.
Gibt es eine FilterFactory, die Interpunktion abziehen soll? Irgendwelche Ideen?
Danke, Bogdan.
Für Menschen mit Grenzfällen wie meins: Die generateWordParts = 1 wird in der Regel arbeiten, aber wenn Sie das tun, was ich tue, wird es nicht: Ich bin mit der Attribut "types" von WDFF, das zugeordnet werden soll. und $ zu ALPHA, damit ich Begriffe wie $ 10.00 zuordnen kann. Dies hat den negativen Nebeneffekt, dass Präfix- und Suffixperioden als Teil des Wortes enthalten sind. In meinem Fall könnte die Antwort von @claytron besser passen. –