改良版本的使用keepalived构建高可用mysql-HA

最近在折腾一个任务调度系统。作为企业级应用的一部分，HA is a must.

作为一个HA的任务调度系统，丢任务自然是不允许的。因此需要将已提交的任务持久化。MySQL是个比较容易想到的持久化容器。同时注意到HA的要求——No single point of failure。MySQL也不能例外。于是就有了今天这个笔记。

MySQL要做到HA,复制是必须的。且failover后要能继续服务，自然得考虑多master的架构。多master下，数据一致性很重要，而数据一致性的保证完全取决于复制。因此决定使用正式引入了semi-sync replication机制的MySQL GA版本：5.5.17。最起码在复制的可靠度上能有所保障——虽然不是100%保证。(MySQL的semi-sync我也只是初接触，后面可以好好看看学习学习)

但是复制只能保证数据的高可用，服务的高可用需要采取另外的手段。所谓服务高可用说白了就是保证客户端能持续地使用MySQL。即便一台MySQL故障，那么在短暂的失败时间内，客户端也可以通过重连来切换到正常的MySQL上，继续刚才的工作。

能想到的最简单方案就是两台MySQL互为master-slave。由MySQL的semi-sync复制来保证数据的连续性。另外考虑到这个系统的特殊性：

用MySQL是来持久化”非永久性”数据的(任务做完了就没必要再留着了)
借助于select for update实现的lock（防止任务被重复调度、更新）

基于以上两点，这个MySQL-HA方案就不需要传统的多slave用于查询的架构了。但同时也要求所有的客户端在同一时刻只能去访问一台MySQL来操作数据。MySQL Cluster和开源的MMM应该都可以满足我上述的需求。但我大致扫了一眼，觉得有点大——比我这个任务调度系统本身还要大，有点本末倒置，而且很复杂——越复杂越容易出错，所以就没有深入看下去。碰巧找到使用keepalived构建高可用mysql-HA这篇guide，简单易操作，符合我的口味。这里主要说说搭建过程中遇到的问题，以及我加的一点优化。

根据上面的叙述，我们有了下面的拓扑。本文的叙述也都是基于这个拓扑来的：

访问数据库的VIP:10.224.178.5

MySQL-A: 10.224.178.164

MySQL-B: 10.224.178.167

两台MySQL都安装keepalived.

[text]# yum install kernel-devel
# wget http://www.keepalived.org/software/keepalived-1.2.1.tar.gz
# tar zxvf keepalived-1.2.1.tar.gz
# ./configure –with-kernel-dir=/usr/src/kernels/2.6.18-274.7.1.el5-x86_64/[/text]

这里选用了keepalived-1.2.1。configure时需要指定内核src目录,这样就可获得IPVS Framework的支持。（没用当前最新的1.2.2的原因是加了–with-kernel-dir后编译不通过，而1.2.1已经可以满足需求了）

keepalived在这个架构中负责两件事：1、VIP的维护； 2、MySQL的healthcheck。

只需要简单的配置文件即可完成这两个任务的设置。

我们自己新建一个配置文件，默认情况下keepalived启动时会去/etc/keepalived目录下找配置文件.

[text]
mkdir /etc/keepalived
vi /etc/keepalived/keepalived.conf
[/text]

这是10.224.178.164上的配置文件

[text highlight=”“0,7,10,12,30,31,34””]#Configuration File for keepalived
global_defs {
router_id MySQL-ha
}

vrrp_instance VI_1 {
state BACKUP #两台配置此处均是BACKUP
interface eth0
virtual_router_id 51
priority 100 #优先级，另一台改为90
advert_int 1
nopreempt #不抢占，只在优先级高的机器上设置即可，优先级低的机器不设置
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
10.224.178.5
}

}
virtual_server 10.224.178.5 3306 {
delay_loop 2 #每个2秒检查一次real_server状态
lb_algo wrr #LVS算法
lb_kind DR #LVS模式
persistence_timeout 60 #会话保持时间
protocol TCP
real_server 10.224.178.164 3306 {
weight 1
notify_down /root/when_db_down.sh #检测到服务down后执行的脚本
notify_up /root/when_db_up.sh

MISC_CHECK {
misc_path “/root/pingM.sh”
misc_timeout 5
}
}
}
[/text]

另一台机器10.224.178.167上的配置也类似，这里就不贴了，按照上面的注释可以很容易的得到。

这里讲下跟引文的区别：

用自己写的MISC_CHEK脚本，而不是简单的TCP_CHECK
检测到服务down后的脚本
检测到服务startup的脚本。

引文中，服务down后的脚本做的工作是直接pkill keepalived。这样直接杀死了keepalived从而使得当前机器的VIP不再对外，从而client访问VIP也就到达不了这台down了的机器上来，新的请求会被另一台VIP开启的机器接管。

这样比较麻烦的一件事情就是当down掉的MySQL重新起来后，还需要在那台机器上手动将keepalived启动，才能再次开启VIP和healthcheck。有人说本来down掉的MySQL就需要手动来启动的啊，只是多做件事情罢了。但是考虑如果MySQL由于过于繁忙，导致healthcheck脚本的连接超时而被认为down了。这种情况无需人工干预MySQL可以自行恢复，那么我们的keepalived最好也能自行恢复。

keepalived强大的启动参数可以帮助我们来实现这一点，但也需要我们写脚本来配合。我在这里做了些改动，主要有四个脚本。

1.startMySQL.sh 用来启动MySQL服务。

[bash]
#!/bin/sh
/etc/init.d/mysql start
keepalived -D -d -S 0 -f /etc/keepalived/keepalived.conf –vrrp_pid /var/run/vrrp.pid
[/bash]

启动MySQL都用这个脚本。它做了两件事情：1、启动mysqld;2、启动keepalived。并且将vrrp进程的pid写入/var/run/vrrp.pid中——这个很关键。

2.pingM.sh 用来监控MySQL服务

[bash]#!/bin/sh
mysql -u root -ppass -N -h 127.0.0.1 -e “select 1;” databasename>>/dev/null
exit $?[/bash]

如果db正常，则返回0.否则返回1.keepalived的判断完全基于这个返回码。

当然，我们可以很灵活地更加个性化地写自己的MySQL监控程序来加入这个脚本，让keepalived的监控更加精确。

3.when_db_down.sh 当MySQL down时触发的脚本

[bash]#!/bin/sh
if [ -f /var/run/vrrp.pid ]; then
pkill keepalived
ip -s -s a f to 10.224.178.5/32
#only run health check when mysql goes down
keepalived -C -D -d -S 0 -f /etc/keepalived/keepalived.conf
fi[/bash]

这里就用到了我们之前写的vrrp.pid文件。我们判断这个文件的存在性，如果存在则关闭整个keepalived服务，然后再单独开启keepalived的healthcheck进程，用来检查MySQL是否又启动了。

这个判断的作用在于，如果MySQL一直未恢复，那么healthcheck进程依旧会定时的触发when_db_down.sh脚本，这时由于vrrp.pid不存在，因而不会做任何事情。免掉了healthcheck进程被pkill杀死又启动这样的麻烦事。

[text]ip -s -s a f to 10.224.178.5/32[/text]

的作用在于手动删除VIP，因为我有时发现keepalived被杀死后，VIP还在ip table中，手动删除确保VIP不再对外。

4.when_db_up.sh 当MySQL恢复后触发的脚本

[bash]#!/bin/sh
pkill keepalived
/root/startMysql.sh[/bash]

杀死当前的healthcheck进程，然后再用脚本1启动MySQL服务。

经过测试，客户端访问10.224.178.5:3306。首先链接机器A，当机器A的MySQL宕机后。客户端会出现connection lost的exception。但3s-5s后重试，便可成功连接到机器B。而当机器A上MySQL恢复后，keepalived自动再次启用VIP，但客户端连接依旧保持在B上——这点很重要！只有当B上的MySQL挂了，连接才会跟之前一样，切换到A上。否则B就一直作为master对外服务。

两台机器其实不分主备，因为都有可能承担全部的服务请求，所以硬件配置上没有孰优孰劣之说。

Written on October 21, 2011