2016-06-07 6 views
2

Wir haben versucht Aerospike Version zu aktualisieren und haben ein seltsames Problem. Wir hatten 3 - Knoten-Cluster-Version 3.5.4 und Replikationsfaktor 2.Aerospike Migration abgebrochen

Und wir entscheiden, 3.8.2.3 zu aktualisieren, so dass wir eine neue Version auf neue Server installiert und hinzugefügt neue Knoten auf Cluster, wir nach der Migration entfernt alten Knoten. Alles war perfekt.

Wir entschieden uns, unseren Algorithmus zu wiederholen. Wir haben einen weiteren neuen Knoten zum Cluster hinzugefügt und gesehen, dass die Migration fehlgeschlagen ist. Wir haben viele Fehler in den Protokollen wie unten beschrieben.

Jun 06 2016 22:43:26 GMT: WARNING (partition): (partition.c::2221) {namespace:3368} migrate rx aborted. During migrate receive start, duplicate partition contains primary version 

Außerdem sahen wir, dass Anzahl der Replik Objekte weniger als Ursprungs Objekte, zum Beispiel:

Unsere Migration Config

So, Wie können wir die Situation beheben?

Antwort

2

Ich sehe aus Ihrer Ausgabe, dass keine Migrationen im Gange sind. Und die Replikanzahlen stimmen nicht mit primären Zählungen überein.

Bis 3.7.0.1 konnten vorherige Migrationen die nachfolgenden Runden stören. Ich vermute, dass das hier passiert ist. Ich empfehle Ihnen, diese Probleme vorerst zu aktualisieren und zu ignorieren. Wenn die Zählungen nach der Fertigstellung immer noch nicht übereinstimmen, müssen Sie die Partitionen zwingen, sich neu zu synchronisieren.

Um das Neusynchronisieren von Partitionen zu erzwingen, geben Sie die folgenden Befehle ein.

asadm -h [NODE IP] -e "cluster dun all"; 
sleep 10; 
asadm -h [NODE IP] -e "cluster undun all"; 

Dies führt dazu, dass alle Partitionsversionen divergieren und neu synchronisiert werden.

Verwandte Themen