2009-04-26 9 views
0

Wie hat SO die getaggte Suche implementiert? Wird Lucene oder eine andere Open-Source-Suchmaschine für die Suche mit Tags verwendet?Verwendet StackOverflow Lucene für markierte Suchanfragen?

Wie kann man am besten Dokumente (PDF, XML, HTML, MS Word) oder Datenbanken durchsuchen?

+1

Siehe "Was war Stack Overflow gebaut": http://stackoverflow.com/questions/749358/ –

Antwort

0

Also ja, es verwendet Lucene.NET, obwohl ich nicht genau weiß, wie. Der "beste" Weg ist eine ganz andere Geschichte.

1

Die Suche nach Tags unterscheidet sich erheblich von der Suche nach Text. Eine markierte Suche sucht nach einer Verknüpfung, bei der alle Fragen mit einem bestimmten Tag verknüpft sind. Dies kann mit einer Volltext-Engine implementiert werden, bei der die Tags alle in einem einzigen großen Eintrag angehängt werden, aber eine relationale Datenbank wird wahrscheinlich in dieser Situation am besten sein (vorausgesetzt, die markierten Daten befinden sich in einer relationalen Datenbank).

Für die Suche nach anderen Dokumenten wie PDF, XLS, HTML, dann benötigen Sie Volltext wie Lucene. Sie benötigen einen Parser, der nur den relevanten Text aus jeder Quelle extrahieren kann (d. H. Separaten Text aus dem Markup).

0

Bei der letzten Diskussion (im Podcast) wurde erwähnt, dass Stackoverflow die Volltextsuchfunktion von SQL Server verwendet, nicht Lucene.

0

SO verwendet Lucene nicht.

Wenn Sie Dokumente indizieren möchten und Windows ausführen, dann wäre IFilters meine erste Wahl.