2009-02-17 15 views
10

Suche nach einem Begriff auf amazon.com, zum Beispiel "Stack Overflow", und die Suchergebnisse kommen sehr schnell zurück.Wie ist Amazon facettierte Suche so schnell?

Auf der linken Seite des Fensters gibt es eine facettierte Suche, die in bestimmten Kategorien die Anzahl der Produkte anzeigt, die mit diesem Begriff übereinstimmen.

Sie können dann in diese Begriffe bohren. Zum Beispiel gibt es 1094 Bücher, die den Begriff entsprechen, die in Computer & Internet (1003), Science, etc.

unterteilt ist Angesichts der Suche nach Büchern deckt den Inhalt einiger dieser Bücher, es scheint mir Das ist eine sehr beeindruckende Leistung.

Wie macht Amazon das? Massive Parallelisierung? zB kennt jeder Knoten ein paar Produkte?

Übrigens ich sah, dass „Stack-Überlauf“ erscheint im Text von „Soul of a New Machine“, ein Buch, das ich von 1981

Antwort

17

Die kurze Antwort ist, eine Menge Indexierung. Die längere Antwort ist, viel Indizierung, viel Redundanz, viel Caching und intelligente Partitionierung.

Die wirkliche Antwort ist - lesen Sie dieses Buch: http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

(Es ist kostenlos, und es ist sehr gut).

+0

Danke für die Buchreferenz. –

+0

Gleich hier, danke für die Referenz – webclimber

+0

Danke für den Link, wusste es nicht, aber es scheint lesenswert. – Jay

0

Nun erinnern, gibt es Parallelisierung, aber eines der Dinge, dass jeder tut Auf dem Backend dieser Art von Dingen laufen langsame Prozesse (wie das semantische Parsen von Buchinhalten) und eine schnelle Suche darauf. Sie speichern die Suchergebnisse buchstäblich in einigen großen Datenbanken, so dass sie nur DAB-Suchen in Ihren Suchergebnissen durchführen müssen. Vielleicht habe ich die Frage missverstanden, aber ähnlich wie Google. Sie denken nicht, dass ihre Spider das Web nach Ihren Seiten durchsuchen, wenn Sie einen Suchbegriff eingeben, oder?