1

Ich bin aufgefordert, entweder eine unternehmensinterne (Intranet) Suchmaschine bereitzustellen oder zu entwickeln, die alle Webseiten von ein paar internen Servern indizieren könnte, und ein Suchportal zum Anzeigen aller verwandten Inhalte, wie Was macht Google aber für das Intranet?Enterprise Search Engine Development um Rat fragen

Haben Sie Ratschläge zur schnellen Entwicklung oder Bereitstellung? Ich habe von Microsoft FAST-Produkt gehört, nicht sicher, ob es für diesen Zweck ist?

Vielen Dank im Voraus, George

+0

Der Intranet-Teil heißt Enterprise Search for Business Productivity: http://www.microsoft.com/enterprisesearch/en/us/business-productivity.aspx – danglund

Antwort

2

Die google search appliance ist eine Hardware-Lösung, die Sie bei der Prüfung interessiert sein könnten. Ein softwarebasierter Ansatz könnte die Lucene Suchmaschine sein.

+0

Cool, und beide von ihnen haben relevante und integriert Ranking-Algorithmen? – George2

+0

Ich denke nicht, dass Lucene so anspruchsvoll ist. Es ist nur ein sehr guter Keyword-Sucher. (Ich habe es nicht geklopft, ich habe es für mehr als ein Projekt verwendet.) –

2

Eine kostenlose Microsoft-Lösung ist Microsoft Search Server Express. Funktioniert ähnlich wie die Suche in SharePoint.

+0

Sieht aus, als ob Windows Search Server Express nur Crawl-Inhalte von SharePoint unterstützen und auf SharePoint laufen kann? – George2

+1

Indexinhalte auf Dateiservern, Websites, Windows SharePoint Services, Microsoft Office SharePoint Server, öffentlichen Exchange Server-Ordnern und Lotus Notes-Repositorys. Und ist eine eigenständige Installation. –

+0

Danke pb! Das ist genau das, was ich will. Wenn ich den Ranking-Teil oder ein anderes relevantes Matching-Teil anpassen muss, sind alle APIs? – George2

3

Abhängig von der benötigten Polierstufe ist das Nutch-Projekt eine fast schlüsselfertige Lösung für Sie. http://lucene.apache.org/nutch/

+0

Was meinst du "Level der Politur, die du brauchst"? – George2

+1

Sie müssen wahrscheinlich Ihr eigenes Frontend schreiben. Ich vermute, aber von verwandten Tools (Solr) wird die Schnittstelle wahrscheinlich aussehen wie etwas, das ein Ingenieur verwenden könnte. –

+0

Danke pb! Das ist genau das, was ich will. Wenn ich den Ranking-Teil oder ein anderes relevantes Matching-Teil anpassen muss, werden alle von Nutch? Ist es einfach zu erweitern? Meine Anforderung ist, dass ich eine sprach- und branchenspezifische Suche entwickeln muss, also einige spezielle Schlüsselwörter wie Extrahieren, Ranking etc. benötigen. Irgendwelche Tipps? – George2

0

George,

Es klingt wie Sie in großer Eile sind.

Sie beginnen besser mit der Einstellung von Erwartungen bei der Überarbeitung, Überarbeitung, Überarbeitung.

Ich empfehle, dass Sie Zeit zu

  • die requirments etablieren, möglicherweise als Grund-, Mittel- und blue-sky

  • bestimmen, welche Suchmaschinen, Frontends, Crawler etc. verbringen ., (entweder Open-Source-oder Hersteller zur Verfügung gestellt), kann wirklich erfüllt Ihre Anforderungen

  • ermitteln Sie die verfügbare Unterstützung für diese Tools und die Wahrscheinlichkeit des Erhaltens pünktliche und praktikable Antworten oder Work-arounds (Open-Source ist zumindest kein Support-Vertrag)

  • nicht versuchen, alles auf einmal zu tun. Führen Sie zuerst den kleinsten Datensatz aus, unabhängig davon, wie hoch Ihr Sponsor in mgmt ist. Sie werden Monate damit verbracht haben, Tests zu machen, nur um einen fatalen großen Fehler im System zu entdecken, oder Ihren Plan

  • kommunizieren Sie mit Ihrem Team und Sponsoren durch Erstellen einer Roadmap zu Ihren verschiedenen Ebenen oder Anforderungen, mit Check- Punkte

  • Soweit eine Vorplanung für sogar ein kleines bis mittleres Corporate Search-Projekt, empfehle ich Martin White, "Making Search Work".

http://www.amazon.com/Making-Search-Work-Implementing-Enterprise/dp/1573873055/ref=sr_1_1?ie=UTF8&qid=1249009370&sr=8-1

Ich glaube, Sie werden feststellen, dass das Ranking und die Relevanz der eine der if-iest Teile lieferte eine gute Suchlösung zu bekommen. Engines bieten wahrscheinlich ähnliche Funktionalitäten, aber die Details, wie es zu tun ist, werden anders sein, und, noch wichtiger, der Erfolg, den Sie mit der Erzwingung von Relevanz haben, wird nur teilweise eine Funktion der Suchmaschine sein, die Sie auswählen.Anders ausgedrückt, wenn Ihr Text nicht mit dem Algorithmus der Suchmaschinen übereinstimmt, werden Sie viel Zeit damit verbringen, verschiedene Tuning-Parameter und ihre Kombinatorik zu verstehen. (Ich kenne bisher nur 2, also können andere dem gerne widersprechen).

Es ist eine großartige Lernerfahrung. Viel Glück.

0

FAST ist eine großartige Produktsuche. Bei allen Bewertungen von Beratungsunternehmen steht es in der Regel an erster Stelle. Es erfordert jedoch eine moderate Menge an technischer Einrichtung und Unterstützung.

Google ist ein weiteres solides Produkt, aber es ist sehr teuer. Es erfordert weniger technischen Support, bietet Ihnen aber auch weniger Kontrolle über die Suchergebnisse.