2016-09-21 3 views
0

Was ich will ist, dass Ergebnisse mit 'Auto' auch angezeigt werden, wenn ich 'Fahrzeug' und andere solche Synonyme in der englischen Sprache suche.Solr Standardliste von Synonymen für englische Sprache

Ich weiß, Solr hat SynonymFilterFactory, die standardmäßig leer ist. Aber ich bin neugierig, ob es einen Standardweg gibt, um alle Wörter für die englische Sprache zu normalisieren. Soll ich synonyms.txt aus einem Thesaurus erzeugen?

Machst du diese Standard-Praxis oder gibt es einen besseren Weg, damit umzugehen?

+0

Synonyme sind stark abhängig von der Domäne der Suche. Java könnte Kaffee für einen Nicht-Programmierer bedeuten - schlechtes Beispiel, aber ich hoffe, Sie haben den Kern dessen, was ich sage. Das Generieren von Synonymen aus Thesaurus kann zu sehr verwirrenden Ergebnissen führen. Wer sind die Zuschauer/Kunden für Ihre Suche? Sie können mit Akronymen und deren Erweiterungen für Ihre spezielle Domain beginnen. – jay

Antwort

0

Werfen Sie einen Blick auf WordNet. Es ist ein Standard-Englisch-Thesaurus-Paket. Es ist in Pythons NLTK-Paket enthalten, und es sollte nicht viel Arbeit sein, ein Skript zu schreiben, das es in dem von SynonymFilterFactory benötigten Format ausgibt.

Aber zu @jay's Point, wirst du eine Menge Hits bekommen, die du wahrscheinlich nicht willst. Wenn Sie sich etwas Zeit nehmen, um Ihren Thesaurus an Ihre Domain anzupassen, zahlen Sie sich aus!

Verwandte Themen