Replikáció beállítása MySQL szerverek között a magas rendelkezésre állásért

A digitális korban az adatok a vállalkozások vérkeringését jelentik. Egy pillanatnyi leállás vagy adatvesztés hatalmas anyagi és reputációs károkat okozhat. A modern alkalmazások és szolgáltatások megkövetelik a magas rendelkezésre állás (HA) biztosítását, ami azt jelenti, hogy az adatbázisoknak a lehető legritkábban, ideális esetben soha nem szabad kiesniük. Itt jön képbe a MySQL replikáció, amely az egyik leghatékonyabb és legelterjedtebb megoldás az adatok biztonságának, konzisztenciájának és az alkalmazások folyamatos működésének garantálására. Ebben a cikkben részletesen áttekintjük a MySQL replikáció alapjait, a beállítás lépéseit, valamint a magas rendelkezésre állás elérésének kulcsfontosságú szempontjait.

Miért elengedhetetlen a MySQL replikáció a magas rendelkezésre álláshoz?

A replikáció lényege, hogy egy forrás adatbázis (gyakran hívjuk masternek vagy elsődleges szervernek) adatváltozásait automatikusan másolja egy vagy több cél adatbázisba (ezek a slave, vagy replika szerverek). Ez a folyamat számos előnnyel jár, különösen a magas rendelkezésre állás szempontjából:

Katásztra-helyreállítás (Disaster Recovery): Ha a master szerver meghibásodik vagy elérhetetlenné válik, a slave szerverek készen állnak arra, hogy átvegyék a szerepét, minimalizálva az állásidőt és az adatvesztést.
Terheléselosztás (Load Balancing): A read-heavy (olvasás-intenzív) alkalmazások képesek az olvasási lekérdezéseket a slave szerverek felé irányítani, tehermentesítve a mastert, és javítva az általános teljesítményt.
Adatbiztonság és Backup: A replikált adatok egyfajta élő biztonsági másolatot jelentenek. Emellett a backup műveletek elvégezhetők a slave szervereken, elkerülve a master szerver terhelését vagy zárolását.
Fejlesztés és Tesztelés: A fejlesztők a slave szerverekről friss adatokat kaphatnak a teszteléshez, anélkül, hogy a produkciós master szervert befolyásolnák.

A MySQL replikáció alapjai és működése

A MySQL replikáció a bináris log (binlog) nevű mechanizmusra épül. Ez a log minden adatváltoztatási eseményt rögzít, ami a master szerveren történik (INSERT, UPDATE, DELETE, CREATE TABLE stb.). A replikáció folyamata a következő lépésekben zajlik:

Master: A master szerverre érkező minden adatváltozás bekerül a bináris logba.
Slave I/O Thread: A slave szerveren futó I/O szál csatlakozik a masterhez, és lekéri a bináris log eseményeket. Ezeket az eseményeket egy helyi fájlba, a relay logba írja.
Slave SQL Thread: Egy másik szál a slave szerveren, az SQL szál, beolvassa a relay log tartalmát, és végrehajtja az ott található SQL parancsokat a slave adatbázison.

A replikációnak három fő típusa van a bináris log formátuma alapján:

Statement-Based Replication (SBR): Az SQL utasításokat rögzíti és továbbítja. Problémás lehet nem-determinisztikus függvények esetén (pl. `UUID()`, `NOW()`), ahol a masteren és a slaven eltérő eredmény születhet.
Row-Based Replication (RBR): Az adatváltozások sor szinten kerülnek rögzítésre. Ez a legbiztonságosabb és legkonzisztensebb forma, mivel csak a ténylegesen megváltozott adatsorok kerülnek át. Javasolt formátum a legtöbb modern alkalmazás esetén.
Mixed Replication: A MySQL automatikusan választ az SBR és RBR között, a körülményektől függően. Ez alapértelmezett beállítás lehet, de RBR-t gyakran preferálják a megbízhatóság miatt.

A magas rendelkezésre állás szempontjából elengedhetetlen a GTID (Global Transaction Identifiers) használata. A GTID egy egyedi azonosító minden egyes tranzakcióhoz, amely a masteren történt. Ez drámaian leegyszerűsíti a failover (átállás) folyamatát, mivel a slave pontosan tudja, mely tranzakciók hiányoznak, és honnan kell folytatnia, függetlenül a bináris log fájlpozícióktól.

Replikációs topológiák

Bár számos komplex replikációs topológia létezik (pl. master-master, körkörös replikáció), a leggyakoribb és a magas rendelkezésre állás alapját képező a Master-Slave architektúra. Ez az, amire a legtöbb esetben szükségünk van:

Master-Slave: Egy master szerver írási műveleteket fogad el, és egy vagy több slave szerverre replikálja az adatokat. A slave-ek általában csak olvasási műveleteket végeznek, de készen állnak a master szerep átvételére.
Master-Master (aktív-passzív): Bár mindkét szerver lehetne master, a magas rendelkezésre állás céljából gyakran csak az egyik fogad írásokat, a másik készenlétben van. Komplexitása miatt csak tapasztalt felhasználóknak javasolt.

Lépésről lépésre: A MySQL replikáció beállítása Master-Slave környezetben

Mielőtt belekezdenénk, győződjünk meg róla, hogy a két MySQL szerverünk (egy master és egy slave) telepítve van, és képesek hálózaton keresztül kommunikálni egymással. Ideális esetben azonos MySQL verziókat használjunk.

1. Előkészületek és előfeltételek

Győződjünk meg róla, hogy a master és a slave szerveren be van állítva a megfelelő hálózati kapcsolat, és a tűzfal szabályok engedélyezik a MySQL port (alapértelmezett: 3306) közötti kommunikációt.

2. Master szerver konfigurálása

Nyissuk meg a MySQL konfigurációs fájlját (általában /etc/mysql/mysql.conf.d/mysqld.cnf vagy /etc/my.cnf) a master szerveren.

[mysqld]
bind-address = 0.0.0.0 # Vagy a master szerver IP-címe
server-id = 1          # Egyedi azonosító, minden szerveren másnak kell lennie
log_bin = mysql_bin    # A bináris log fájl neve
binlog_format = ROW    # Ajánlott, a legbiztonságosabb
gtid_mode = ON         # Erősen ajánlott, egyszerűsíti a failovert
enforce_gtid_consistency = ON # Szintén ajánlott

Ne felejtsük el újraindítani a MySQL szolgáltatást a változtatások érvényesítéséhez:

sudo systemctl restart mysql

Replikációs felhasználó létrehozása

Csatlakozzunk a MySQL master szerverhez root felhasználóként, és hozzunk létre egy dedikált felhasználót a replikációhoz. Cseréljük le a repl_user-t és 'a_nagyon_eros_jelszo'-t valós értékekre, és adjuk meg a slave szerver IP-címét a 'slave_ip_address' helyére.

CREATE USER 'repl_user'@'slave_ip_address' IDENTIFIED BY 'a_nagyon_eros_jelszo';
GRANT REPLICATION SLAVE ON *.* TO 'repl_user'@'slave_ip_address';
FLUSH PRIVILEGES;

Ha több slave szerverünk van, vagy a slave IP-címe változhat, használhatjuk a '%'-ot a 'slave_ip_address' helyett, de ez biztonsági kockázatot jelenthet. Célszerű pontos IP-címeket megadni, vagy VPN-t használni.

Master állapotának ellenőrzése és kezdeti snapshot készítése

Ahhoz, hogy a slave tudja, honnan kell elkezdenie a replikációt, szükségünk van a master aktuális bináris log pozíciójára vagy a GTID állapotára. A legegyszerűbb módja egy konzisztens backup elkészítésének:

FLUSH TABLES WITH READ LOCK; # Ez blokkolja az összes írási műveletet!
SHOW MASTER STATUS;

Jegyezzük fel a File és Position értékeket, ha GTID nélkül dolgozunk. Ha GTID-t használunk, a SHOW MASTER STATUS kimenetében a Executed_Gtid_Set lesz a fontos. Hagyjuk nyitva ezt a MySQL munkamenetet, amíg el nem készült a master adatbázis tartalmának mentése.

Készítsünk egy mysqldump-ot a master adatbázisról (egy másik terminálablakban):

mysqldump -u root -p --all-databases --single-transaction --gtid --flush-logs --master-data=2 > master_backup.sql

Amint a dump elkészült, feloldhatjuk a zárolást az első terminálban:

UNLOCK TABLES;

Másoljuk át a master_backup.sql fájlt a slave szerverre.

3. Slave szerver konfigurálása

Nyissuk meg a MySQL konfigurációs fájlját a slave szerveren:

[mysqld]
bind-address = 0.0.0.0 # Vagy a slave szerver IP-címe
server-id = 2          # Egyedi azonosító, eltérő a mastertől!
relay_log = mysql_relay_bin # A relay log fájl neve
read_only = ON         # Ajánlott, megakadályozza az írásokat a slaven
gtid_mode = ON
enforce_gtid_consistency = ON

Indítsuk újra a MySQL szolgáltatást a slave szerveren:

sudo systemctl restart mysql

Backup visszaállítása a slave-re

Töltsük be a masterről átmásolt backupot a slave szerverre:

mysql -u root -p < master_backup.sql

Replikáció elindítása

Most csatlakozzunk a MySQL slave szerverhez root felhasználóként, és konfiguráljuk a replikációt. A GTID használatával ez sokkal egyszerűbb:

STOP SLAVE;
RESET MASTER; # Tiszta lappal indulunk
CHANGE MASTER TO
    MASTER_HOST='master_ip_address',
    MASTER_USER='repl_user',
    MASTER_PASSWORD='a_nagyon_eros_jelszo',
    MASTER_PORT=3306,
    GET_MASTER_PUBLIC_KEY=1, -- MySQL 8.0+ esetén
    MASTER_AUTO_POSITION=1; -- Ez kulcsfontosságú a GTID esetén!
START SLAVE;

Ha valamilyen oknál fogva nem használunk GTID-t (nem ajánlott!), akkor a MASTER_AUTO_POSITION=1 helyett a SHOW MASTER STATUS kimenetéből származó File és Position értékeket kell megadnunk:

CHANGE MASTER TO
    MASTER_LOG_FILE='mysql_bin.000001',
    MASTER_LOG_POS=12345;

4. Replikáció ellenőrzése

A slave szerveren ellenőrizzük a replikáció állapotát:

SHOW SLAVE STATUSG

A kimenetben keressük a következő sorokat:

Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Last_IO_Errno: 0
Last_SQL_Errno: 0
Seconds_Behind_Master: 0 (ez azt jelzi, hogy a slave utolérte a mastert)

Ha minden Yes, 0, akkor a replikáció sikeresen működik!

Magas rendelkezésre állás és a replikáció kihívásai

Bár a replikáció kiváló alapja a HA-nak, önmagában nem oldja meg a teljes problémát. A következő szempontokat is figyelembe kell venni:

Replikációs késleltetés (Replication Lag): Ha a slave SQL szál nem tudja elég gyorsan feldolgozni a masterről érkező eseményeket, késés alakulhat ki. Ezt okozhatja a slave alulteljesítése, rossz indexelés, vagy a masteren történő nagyon sok írás. Monitorozás és optimalizálás elengedhetetlen.
Failover (átállás): Mi történik, ha a master meghibásodik? Manuális átállás során nekünk kell kiválasztani egy slave-et, előléptetni masterré, és átirányítani az alkalmazást. Automatikus failover megoldások (pl. MHA, Orchestrator) léteznek, amelyek felügyelik a fürtöt és automatikusan elvégzik az átállást.
Adatkonzisztencia: Az aszinkron replikáció miatt rövid időre adatkonzisztencia problémák léphetnek fel a master és a slave között. A semi-synchronous replication segíthet ezen, biztosítva, hogy legalább egy slave visszaigazolja az esemény fogadását, mielőtt a master commit-álja a tranzakciót.
Monitoring: Folyamatosan figyelni kell a replikáció állapotát (SHOW SLAVE STATUS), a szerverek erőforrás-kihasználtságát, és a hálózati késleltetést.
MySQL Group Replication: Komolyabb, zero-data-loss HA megoldásokhoz érdemes megfontolni a MySQL Group Replication-t, amely egy beépített, multi-master képességű megoldás, amely konszenzus alapú protokollal biztosítja az adatok konzisztenciáját a fürtben. Ez egy fejlettebb technológia, ami már túlmutat a klasszikus master-slave felállításon.

Gyakorlati tippek és bevált gyakorlatok

Dedikált hardver: A master és a slave szervereknek is elegendő erőforrással (CPU, RAM, gyors tároló) kell rendelkezniük.
Identikus konfigurációk: Próbáljuk meg a lehető leginkább azonosra konfigurálni a master és a slave szervereket, különösen a MySQL verziót és a konfigurációs paramétereket illetően.
Rendszeres backupok: A replikáció nem helyettesíti a rendszeres adatmentéseket! A backupok elengedhetetlenek a korábbi állapotok visszaállításához, például emberi hiba esetén.
Tesztek: Rendszeresen teszteljük a failover folyamatot, hogy biztosak legyünk benne, vészhelyzet esetén zökkenőmentesen működik.
Biztonság: Használjunk erős jelszavakat a replikációs felhasználóhoz, és korlátozzuk a hozzáférést a slave IP-címére. Fontoljuk meg az SSL használatát a replikációs forgalom titkosításához.

Konklúzió

A MySQL replikáció beállítása a magas rendelkezésre állásért egy alapvető lépés minden komoly produkciós környezetben. A megfelelő konfigurációval és monitorozással nemcsak az adatok biztonságát garantálhatjuk, hanem az alkalmazások folyamatos működését is biztosíthatjuk, minimalizálva az üzleti kockázatokat. Bár az alapvető master-slave beállítás viszonylag egyszerű, a valódi HA eléréséhez további eszközök és stratégiák is szükségesek, mint például a GTID, a semi-synchronous replikáció, vagy komplexebb megoldások, mint a Group Replication. Fektessünk időt a tervezésbe és tesztelésbe, hogy egy robusztus és megbízható adatbázis infrastruktúrát építhessünk ki.