Ich benutze MSSQLs Volltextindizierung auf einer Handvoll Tabellen in meinem CMS und bin leider mit SQL Server 2000 festgefahren. Ich frage den Index mit freetextable Joins und habe ziemlich gute Ergebnisse, aber wir haben einige eindeutige Begriffe, die sind wahrscheinlich Suchanfragen, die nicht zu stempeln scheinen. Zum Beispiel gibt eine Abfrage mit dem Begriff "Smartbar" ein paar Zeilen zurück, aber eine mit "Smartbars" gibt eine andere, nur teilweise überlappende Ergebnismenge zurück.Führen Sie MS SQL Server 2000-Volltextindexabfragen mithilfe von freutextable using stemming aus?
Wenn ich das Stemming-Konzept richtig verstehe, würde ich annehmen, dass die erste Abfrage alle Zeilen in der zweiten Abfrage enthalten würde, aber es nicht.
Mit Blick auf MSDN-Onlinedokumentation erwähnt this page Stemming in der freetext_string Parameter Kommentare, aber this page nicht. Davon ausgehend würde ich annehmen, dass SQL Server 2000 die Wörter in der Freetexttable-Abfrage nicht abstößt; Ist das eine korrekte Annahme? Gibt es eine Möglichkeit, SQL Server 2000 zu ermutigen oder zu aktivieren, um einzudämmen? Als Rückfall werde ich wahrscheinlich die Thesaurus-Dateien für wichtige Abfragen nach unseren einzigartigen Begriffen verwenden, aber SQL Server sollte den Großteil der Arbeit übernehmen.
Als Follow-up, wenn jemand Links zu guten Ressourcen in Bezug auf SQL Server 2000 Volltext-Abfragen hat, würde ich sie sehr schätzen. Die MSDN-Informationen sind nützlich, aber ich würde gerne detailliertere Informationen erhalten und nicht viel finden können.
ausgezeichnet, danke dafür. Ich werde es überprüfen und sehen, ob es hilft, die zusätzlichen Formulare zu finden. – cori
Ich konnte dies auf unseren Daten nicht testen - die Benutzer hatten die Daten bereinigt, bevor ich es versuchen konnte, aber basierend auf diesem [http://msdn.microsoft.com/en-us/library/ms142509 (SQL.90) .aspx] Ich glaube, das hätte es nicht behoben, denn "Smartbar" ist kein anerkanntes englisches Wort, und stemming (und ich denke, durch Wortformen von Erweiterungen) funktioniert gegen ein bekanntes Wörterbuch. Ich denke, wir werden den Thesaurus verwenden, was nicht wirklich unangemessen ist, da wir proprietäre Begriffe betrachten. – cori
Wenn Sie diese Flexibilität wünschen, sollten Sie sich Apache Solr ansehen (ein Suchserver, der auf dem Volltextindex von Apache Lucene basiert). – AlexS