2013-06-11 9 views
31

Ich habe Mühe mit dem Verständnis der Unterschied zwischen Sammlungen und Kerne. Wenn ich es richtig verstehe, sind Kerne mehrere Indizes. Die Sammlung besteht aus Kernen, so dass sie im Wesentlichen die gleiche logische Trennung aufweisen, d. H. Separate Kerne und Sammlungen haben getrennte Endpunkte.Solr Collection vs Cores

Ich habe folgendes Szenario. Ich erstelle ein Backend für den Cloud-Service für mehrere Online-Shops. Jeder Shop hat eine Reihe von Produkten, zu denen Kunden Bewertungen hinzufügen können. Ich möchte statische Daten (Produktinformationen) getrennt von dynamischen Informationen (Rezensionen) indexieren, um die Leistung zu verbessern.

Wie kann ich am besten in Solr trennen ???

Antwort

41

Vom SolrCloud Documentation

Collection: Eine einzige Suchindex.

Shard: Ein logischer Abschnitt einer einzelnen Sammlung (auch Slice genannt). Manchmal werden die Leute reden über „Shard“ im physischen Sinne (eine Manifestation einer logischen Scherbe)

Replik: Eine physische Manifestation eines logischen Shard, implementiert als einzelner Lucene-Index auf einem SolrCore

Führer : Eine Replik von jedem Shard wird als Leader zu Koordinatenindizierung für diesen Shard bestimmt.

SolrCore: Kapselt einen einzelnen physischen Index. Ein oder mehrere make up logische Shards (oder Slices), die eine Sammlung bilden.

Knoten: Eine einzelne Instanz von Solr. Eine einzelne Solr-Instanz kann mehrere SolrCores enthalten, die Teil einer beliebigen Anzahl von Sammlungen sein können.

Cluster: Alle Knoten, die Sie zum Hosten von SolrCores verwenden.

Also im Grunde eine Sammlung (logische Gruppe) hat mehrere Kerne (physische Indizes).

Überprüfen Sie auch die discussion

+1

Bitte fügen Sie Kommentar für jede unten Stimme hilft, die Antwort zu verbessern !!!! – Jayendra

+0

Was ist Suchindex bitte? – Sun

22

Kern

In Solr, ein core besteht aus einer Reihe von Konfigurationsdateien, Lucene Indexdateien und Transaktionslog der Solr.

Ein Solr-Kern ist ein eindeutig benannter, verwalteter und konfigurierter Index, der auf einem Solr-Server ausgeführt wird. Ein Solr-Server kann einen oder mehrere Kerne hosten. Ein Kern wird in der Regel auf separaten Dokumenten verwendet, die verschiedene Schemata

Sammlung

Solr verwendet auch den Begriff collection, die nur im Kontext, in dem eines Solr Cluster Bedeutung hat ein einzelner Index verteilt wird über mehrere Server.

SolrCloud führt das Konzept eines collection, die das Konzept eines eindeutig benannt erstreckt, verwaltet und konfiguriert Index auf eine, die in Scherben und verteilte auf mehrere Server aufgeteilt ist.

9

Gemäß meinem Verständnis:

In verteilten Suche,

Sammlung ist ein logischer Index auf mehrere Server verteilt. Kern ist der Teil des Servers, die eine Sammlung ausgeführt wird.

In nicht ausgeschüttete Suche,

Einzel-Server läuft die Solr mehrere Sammlungen haben können und jeder dieser Sammlung ist auch ein Kern. So sind Sammlung und Kern gleich, wenn Suche nicht verteilt wird.

Zusammenfassung

  1. Sammlung pro Server ist ein Kern bezeichnet.
  2. Sammlung ist das gleiche wie ein Index.
  3. Ein Solr-Server kann viele Kerne haben.
  4. Sammlung ist ein logischer Index (Beispiel Verwendung für mehrere Sammlungen: Sagen zwei Teams in der gleichen Gruppe sind nicht groß genug, um einen vollständigen Solr-Server ihrer eigenen zu rechtfertigen. Aber sie wollen auch nicht ihre Daten in einem einzigen Index mischen. Sie können dann separate Sammlungen/Indizes erstellen, die ihre Daten getrennt halten).
  5. Es ist besser, eine separate Solr Wolke zu verwenden, anstatt Sammlungen zu erstellen, wenn die Daten für eine Sammlung groß genug ist
5

Von Solr Wiki (nicht sicher, Kommentare bitte?):

Kollektionen sind aus von einem oder mehreren Scherben. Splitter haben eine oder mehr Repliken. Jedes Replikat ist ein Kern. Eine einzelne Sammlung repräsentiert einen einzelnen logischen Index.

1

Single Instance

Auf einer einzigen Instanz, Solr hat etwas namens ein SolrCore, die im Wesentlichen ein einzelner Index ist. Wenn Sie mehrere Indizes erstellen möchten, erstellen Sie mehrere SolrCores.

Solr Wolke

Mit SolrCloud kann ein einzelner Index mehrere Solr Instanzen umfassen. Dies bedeutet, dass ein einzelner Index aus mehreren SolrCores auf verschiedenen Maschinen bestehen kann. Wir nennen all diese SolrCores, die einen logischen Index bilden, eine Sammlung.

Eine Sammlung ist im Wesentlichen ein einzelner Index, der viele SolrCores umfasst, sowohl für die Indexskalierung als auch für die Redundanz. Wenn Sie Ihr 2 SolrCore Solr-Setup zu SolrCloud verschieben möchten, haben Sie 2 Sammlungen, die jeweils aus mehreren einzelnen SolrCores bestehen.

1

Dies erklärt die Verwendung von Kernen und Sammlungen.

Single Instance

Wenn mit einer einzelnen Instanz solr Umgang Abfrage, die Sie cores.

Der Admin UI eines einzelnen Solr Instanz hat keine Sammlung Selektor:

Single Solr Instance

Solr Wolke

Wenn mit Solr Wolke Umgang Abfrage, die Sie collections. Die Sammlungen sind in verschiedenen Kernen (Replikate, Shards) auf verschiedenen solr-Instanzen organisiert.

Die Admin-Benutzeroberfläche einer Solr Cloud-Instanz verfügt über einen Auflistungs- und Kernselektor. Aber Kerne sind technisch Fällen hier:

Solr Cloud instance