2017-09-07 2 views
1

Ich habe eine einfache Master-> Slave-Betrieb mit MariaDB:pt-table-Prüfsumme nicht Erkennung diffs

Master: Ubuntu 16.04 LTS mit MariaDB 10.2.8 und Percona-Toolkit 3.0.4

Slave: Ubuntu 16.04 LTS mit MariaDB 10.2.7

Replikation läuft gut und jetzt möchte ich überprüfen, ob die Daten zwischen Master und Slave identisch sind.

Ich installierte Percona-Toolkit auf dem Master und erstellt eine Prüfsumme Benutzer:

MariaDB> GRANT REPLICATION SLAVE,PROCESS,SUPER, SELECT ON *.* TO `pt_checksum`@'%' IDENTIFIED BY 'password'; 
MariaDB> GRANT ALL PRIVILEGES ON percona.* TO `pt_checksum`@'%'; 
MariaDB> FLUSH PRIVILEGES; 

ich auch hinzugefügt report_host in der Slave-conf, so dass es präsentiert sich dem Master:

MariaDB [(none)]> show slave hosts; 
+-----------+-----------+------+-----------+ 
| Server_id | Host  | Port | Master_id | 
+-----------+-----------+------+-----------+ 
|   2 | 10.0.0.49 | 3306 |   1 | 
+-----------+-----------+------+-----------+ 
1 row in set (0.00 sec) 

Um pt-table-checksum zu testen, entfernte ich eine Zeile aus der Tickets Tabelle in meiner Test-Datenbank auf dem Slave. Ich habe überprüft, dass diese Zeile tatsächlich fehlt, aber immer noch auf dem Master vorhanden ist.

Aber pt-table-Prüfsumme berichten nicht über diese Differenz:

# pt-table-checksum --databases=shop_test --tables=Tickets --host=localhost --user=pt_checksum --password=... --no-check-binlog-format --no-check-replication-filters 
     TS ERRORS DIFFS  ROWS CHUNKS SKIPPED TIME TABLE 
09-07T16:15:02  0  0  14  1  0 0.013 shop_test.Tickets 

Also habe ich PTDEBUG = 1 in meiner Umgebung, aber es scheint, dass der Master zum Slave fein verbindet. Ich habe versucht, die entsprechenden Bits aus dem Ausgang herausgreifen:

# MasterSlave:5175 9725 Connected to h=localhost,p=...,u=pt_checksum 
# MasterSlave:5184 9725 SELECT @@SERVER_ID 
# MasterSlave:5186 9725 Working on server ID 1 
# MasterSlave:5219 9725 Looking for slaves on h=localhost,p=...,u=pt_checksum using methods processlist hosts 
# MasterSlave:5226 9725 Finding slaves with _find_slaves_by_processlist 
# MasterSlave:5288 9725 DBI::db=HASH(0x31c5190) SHOW GRANTS FOR CURRENT_USER() 
# MasterSlave:5318 9725 DBI::db=HASH(0x31c5190) SHOW FULL PROCESSLIST 
# DSNParser:1417 9725 Parsing h=10.0.0.49 
[...] 
# MasterSlave:5231 9725 Found 1 slaves 
# MasterSlave:5208 9725 Recursing from h=localhost,p=...,u=pt_checksum to h=10.0.0.49,p=...,u=pt_checksum 
# MasterSlave:5155 9725 Recursion methods: processlist hosts 
[...] 
# MasterSlave:5175 9725 Connected to h=10.0.0.49,p=...,u=pt_checksum 
# MasterSlave:5184 9725 SELECT @@SERVER_ID 
# MasterSlave:5186 9725 Working on server ID 2 
# MasterSlave:5097 9725 Found slave: h=10.0.0.49,p=...,u=pt_checksum 
[...] 
# pt_table_checksum:9793 9725 Exit status 0 oktorun 1 
# Cxn:3764 9725 Destroying cxn 
# Cxn:3774 9725 DBI::db=HASH(0x31cd218) Disconnecting dbh on slaveserver h=10.0.0.49 
# Cxn:3764 9725 Destroying cxn 
# Cxn:3774 9725 DBI::db=HASH(0x31c5190) Disconnecting dbh on masterserver h=localhost 

ich aus Ideen bin, wie, warum die fehlende Zeile nicht erkannt wird?

Antwort

0

Ich bemerkte einen neuen Fehlerbericht während des Wochenendes, und ich habe heute bestätigt, dass dies tatsächlich das Problem ist, das ich erfahre.

Die Problemumgehung besteht darin, --set-vars binlog_format=statement hinzuzufügen.

Wenn ich diese Option einstelle, zeigt sich der Unterschied nach dem zweiten Durchlauf.

Im ersten Lauf die Prüfsumme Tabelle auf dem Slave aus ändert:

MariaDB [percona]> select tbl, this_crc, this_cnt, master_crc,master_cnt from checksums where tbl = 'Tickets' and db = 'shop_test'; 
+---------+----------+----------+------------+------------+ 
| tbl  | this_crc | this_cnt | master_crc | master_cnt | 
+---------+----------+----------+------------+------------+ 
| Tickets | f30abebe |  14 | f30abebe |   14 | 
+---------+----------+----------+------------+------------+ 

... bis ...

MariaDB [percona]> select tbl, this_crc, this_cnt, master_crc,master_cnt from checksums where tbl = 'Tickets' and db = 'shop_test'; 
+---------+----------+----------+------------+------------+ 
| tbl  | this_crc | this_cnt | master_crc | master_cnt | 
+---------+----------+----------+------------+------------+ 
| Tickets | 284ec207 |  13 | f30abebe |   14 | 
+---------+----------+----------+------------+------------+ 

Und nach dem zweiten Lauf, der Unterschied ist auch in pt-Prüfsumme-Tabellenausgabe:

# pt-table-checksum --tables=shop_test.Tickets --host=localhost --user=pt_checksum --password=... --no-check-binlog-format --no-check-replication-filters --set-vars binlog_format=statement 
      TS ERRORS DIFFS  ROWS CHUNKS SKIPPED TIME TABLE 
09-11T11:17:37  0  1  14  1  0 0.022 shop_test.Tickets 

ich habe mit SHOW VARIABLES LIKE 'binlog_format' dass binlog_format noch 'gemischten', Offensichtlich ändert sich das nur für die Dauer der Sitzung. Nach dem doc, sollte dies automatisch geschehen, soweit ich das verstehen:

Dies funktioniert nur mit dem anweisungsbasierten Replikation (pt-table-Prüfsumme das binlog Format STATEMENT für die Dauer der wechseln Sitzung, wenn Ihr Server zeilenbasierte Replikation verwendet.

Bugreport: https://bugs.launchpad.net/percona-toolkit/+bug/1715801