2012-11-05 5 views
5

Wir verwenden Solr 3.6 in Master-Slave-Konfiguration, 100er Kerne, 100 Millionen Dokumente und benötigen rund um die Uhr Betriebszeit. Wir möchten auf Solr 4.0 upgraden.Migrieren Solr von 3.6 zu 4.0, Methode, um es zu tun, und ist es sicher?


Ich glaube, die richtige Methode ein Dateisystem des alten Indizes an den neuen Speicherort kopieren zu tun ist, und konfiguriert SolrConfig mit:

<luceneMatchVersion>LUCENE_33</luceneMatchVersion> 

Frage 1: Werden dieser Solr Gebrauch machen das veraltete Format? Wird diese den Index in das Format 4.0 online konvertieren?


Frage 2: Gibt es eine bessere Methode, die geringere Ausfallzeiten benötigt die Indizes zu konvertieren? Kann ich vom alten Server auf den neuen replizieren?


Frage 3: Und kann jemand bestätigen, wenn Solr 4.0 für so starke Nutzung wie bei uns sicher ist?

Antwort

0

Wie wäre es mit beiden Versionen von solr 3.6 und 4.0 auf jeder Maschine (verschiedene Ports offensichtlich), so dass Sie es ausprobieren und gegebenenfalls zurückrollen können?

1

Wenn Sie halten

<luceneMatchVersion>LUCENE_33</luceneMatchVersion> 

statt mit:

<luceneMatchVersion>LUCENE_40</luceneMatchVersion> 

werden Sie nicht den vollen Nutzen aus Solr 4/Lucene 4. bekommen jedoch nicht zu LUCENE_40 wechseln können alle Indizes ohne Wiederaufbau . Wenn Sie bei LUCENE_33 bleiben, wird immer noch das alte Indexformat verwendet.

Für Frage 2, wenn Sie genügend Ressourcen haben, richten Sie eine zweite Instanz von Solr ein und kopieren Sie Indizes nach Solr4. Dies kann durch Schreiben eines Java-Programms mit SolrJ erfolgen. Ich bin mir nicht sicher, ob es da draußen irgendwelche gibt, aber es gibt sie wahrscheinlich.

Vorteil: Sie können es live tun.

Nachteil: funktioniert nicht gut, wenn Ihre Solr 3-Instanz ständig aktualisiert wird.

Wenn Sie einen Zeitstempel-Feld haben, die das Datum/Uhrzeit jeder Datensatz erfasst wurde aktualisiert, ähnlich der folgenden:

<field name="timestamp" type="date" indexed="true" stored="true" default="NOW" multiValued="false"/> 

dies kann als einfacher sein, wenn Sie gerade lesen Sie eine Abfrage tun können, wo der Zeitstempel ist kleiner als das aktuelle Datum, dessen Ergebnisse sich weniger wahrscheinlich ändern, wenn Sie über Ergebnisse iterieren (obwohl dies nicht unmöglich ist, wenn vorhandene Datensätze aktualisiert oder gelöscht werden).


Wir haben Solr 4.0 seit über vier Monaten jetzt ohne Probleme laufen. Es ist ein einzelner Solr-Kern mit 150 Millionen Dokumenten.

Verwandte Themen