需求
实现一个HA mysql
,包括1个master,2个slave。在K8S上已statefulset
部署。
mysql HA原理
略
K8S环境需要解决的问题
1、由于使用同一个statefulset
配置,因此需要考虑master和slave使用不同的cnf文件。
2、不同pod之间文件的传输
3、容器重启之后,有些状态不能改变。
K8S部署
configmap
apiVersion: v1
kind: ConfigMap
metadata:
name: mysql
labels:
app: mysql
data:
master.cnf: |
# Apply this config only on the master.
[mysqld]
log-bin
slave.cnf: |
# Apply this config only on slaves.
[mysqld]
super-read-only
master.cnf
用于master
节点,slave.cnf
用于slave
节点。
service
#写要通过mysql-0来写
apiVersion: v1
kind: Service
metadata:
name: mysql
labels:
app: mysql
spec:
ports:
- name: mysql
port: 3306
clusterIP: None #与service不同
selector:
app: mysql
---
#用于读
apiVersion: v1
kind: Service
metadata:
name: mysql-read
labels:
app: mysql
spec:
ports:
- name: mysql
port: 3306
selector:
app: mysql
statefulset
apiVersion: apps/v1
kind: StatefulSet
metadata:
name: mysql
spec:
selector:
matchLabels:
app: mysql
serviceName: mysql
replicas: 3
template:
metadata:
labels:
app: mysql
spec:
#----------------初始化容器部分-----------------
initContainers: //pod初始化阶段,第一个初始化容器
#=============== 初始化mysql
- name: init-mysql
image: reg.westos.org/k8s/mysql:5.7
command:
- bash
- "-c"
- |
set -ex
# 通过hostname创建 mysql server-id 。
[[ `hostname` =~ -([0-9]+)$ ]] || exit 1
ordinal=${BASH_REMATCH[1]}
echo [mysqld] > /mnt/conf.d/server-id.cnf
# Add an offset to avoid reserved server-id=0 value.
echo server-id=$((100 + $ordinal)) >> /mnt/conf.d/server-id.cnf
# 根据pod序号从configmap拷贝不同cnf
if [[ $ordinal -eq 0 ]]; then
cp /mnt/config-map/master.cnf /mnt/conf.d/
else
cp /mnt/config-map/slave.cnf /mnt/conf.d/
fi
volumeMounts:
- name: conf #emptyDir保证每次启动pod都会重新生成,这样每次configmap都会生效。
mountPath: /mnt/conf.d
- name: config-map
mountPath: /mnt/config-map
#==========拷贝数据文件
- name: clone-mysql //第二个初始化容器,主从复制
image: reg.westos.org/k8s/xtrabackup:1.0
command:
- bash
- "-c"
- |
set -ex
# 数据已存在则退出.
[[ -d /var/lib/mysql/mysql ]] && exit 0
# master节点 直接退出 (ordinal index 0).
[[ `hostname` =~ -([0-9]+)$ ]] || exit 1
ordinal=${BASH_REMATCH[1]}
[[ $ordinal -eq 0 ]] && exit 0
# 从其他节点(前一个节点)拷贝数据文件. 仅接收数据,接收完数据就退出。
ncat --recv-only mysql-$(($ordinal-1)).mysql 3307 | xbstream -x -C /var/lib/mysql
# 准备备份为后面的节点服务.
xtrabackup --prepare --target-dir=/var/lib/mysql
volumeMounts:
- name: data
mountPath: /var/lib/mysql
subPath: mysql
- name: conf
mountPath: /etc/mysql/conf.d
#--------------容器定义部分--------------------
containers:
#===========mysql容器
- name: mysql
image: reg.westos.org/k8s/mysql:5.7
env:
- name: MYSQL_ALLOW_EMPTY_PASSWORD
value: "1"
ports:
- name: mysql
containerPort: 3306
volumeMounts:
- name: data
mountPath: /var/lib/mysql
subPath: mysql
- name: conf
mountPath: /etc/mysql/conf.d
resources:
requests:
cpu: 500m
memory: 1Gi
livenessProbe:
exec:
command: ["mysqladmin", "ping"]
initialDelaySeconds: 30
periodSeconds: 10
timeoutSeconds: 5
readinessProbe:
exec:
# Check we can execute queries over TCP (skip-networking is off).
command: ["mysql", "-h", "127.0.0.1", "-e", "SELECT 1"]
initialDelaySeconds: 5
periodSeconds: 2
timeoutSeconds: 1
#========= 备份容器
- name: xtrabackup
image: reg.westos.org/k8s/xtrabackup:1.0
ports:
- name: xtrabackup
containerPort: 3307
command:
- bash
- "-c"
- |
set -ex
cd /var/lib/mysql
# 从备份信息文件里读取MASTER_LOG_FILEM和MASTER_LOG_POS这两个字段的值,用来拼装集群初始化SQL
if [[ -f xtrabackup_slave_info && "x$(<xtrabackup_slave_info)" != "x" ]]; then
# 如果xtrabackup_slave_info文件存在,说明这个备份数据来自于另一个Slave节点。
#这种情况下,XtraBackup工具在备份的时候,就已经在这个文件里自动生成了"CHANGE MASTER TO" SQL语句。
#所以,我们只需要把这个文件重命名为change_master_to.sql.in,后面直接使用即可
# 由于从slave节点拷贝,因此把最后一个分号去掉。
cat xtrabackup_slave_info | sed -E 's/;$//g' > change_master_to.sql.in
# 就用不着xtrabackup_binlog_info了,删除
rm -f xtrabackup_slave_info xtrabackup_binlog_info
elif [[ -f xtrabackup_binlog_info ]]; then
#如果只存在xtrabackup_binlog_inf文件,那说明备份来自于Master节点,
#我们就需要解析这个备份信息文件,读取MASTER_LOG_FILEM和MASTER_LOG_POS这两个字段的值
[[ `cat xtrabackup_binlog_info` =~ ^(.*?)[[:space:]]+(.*?)$ ]] || exit 1
#删除不用了
rm -f xtrabackup_binlog_info xtrabackup_slave_info
echo "CHANGE MASTER TO MASTER_LOG_FILE='${BASH_REMATCH[1]}',\
MASTER_LOG_POS=${BASH_REMATCH[2]}" > change_master_to.sql.in
fi
# 如果change_master_to.sql.in存在,就意味着需要做集群初始化工作
if [[ -f change_master_to.sql.in ]]; then
#一定要先等MySQL容器启动之后才能进行下一步连接MySQL的操作
echo "Waiting for mysqld to be ready (accepting connections)"
until mysql -h 127.0.0.1 -e "SELECT 1"; do sleep 1; done
echo "Initializing replication from clone position"
# 使用change_master_to.sql.in的内容,拼装SQL,组成一个完整的初始化和启动Slave的SQL语句
mysql -h 127.0.0.1 \
-e "$(<change_master_to.sql.in), \
MASTER_HOST='mysql-0.mysql', \
MASTER_USER='root', \
MASTER_PASSWORD='', \
MASTER_CONNECT_RETRY=10; \
START SLAVE;" || exit 1
# 将文件change_master_to.sql.in改个名字,防止这个Container重启的时候,因为又找到了change_master_to.sql.in,从而重复执行一遍这个初始化流程
mv change_master_to.sql.in change_master_to.sql.orig
fi
#使用ncat监听3307端口。它的作用是,在收到传输请求的时候,直接执行"xtrabackup --backup"命令,备份MySQL的数据并发送给请求者
exec ncat --listen --keep-open --send-only --max-conns=1 3307 -c \
"xtrabackup --backup --slave-info --stream=xbstream --host=127.0.0.1 --user=root"
volumeMounts:
- name: data
mountPath: /var/lib/mysql
subPath: mysql
- name: conf
mountPath: /etc/mysql/conf.d
resources:
requests:
cpu: 100m
memory: 100Mi
volumes:
- name: conf
emptyDir: {}
- name: config-map
configMap:
name: mysql
#---------------数据持久化部分-----------------
volumeClaimTemplates:
- metadata:
name: data
spec:
accessModes: ["ReadWriteOnce"]
resources:
requests:
storage: 10Gi
原理
部署结构

使用statefulset
部署pod,headless service
访问服务。service 访问read节点。
init-mysql
容器
init-mysql
容器主要用于根据节点的类型不同生成server-id
和拷贝cnf
文件。
容器使用的目录是容器内部的目录,因此每次启动pod,容器都会重新创建。server-id
不会变。
clone-mysql
容器
容器主要用于从其他节点拷贝数据文件到 slave节点。
mysql
容器
mysql
运行容器。
xtrabackup
容器
备份还原工具
共享目录
conf
目录 挂载在init-mysql
容器的/mnt/conf.d
目录,clone-mysql
容器的/etc/mysql/conf.d
目录,,mysql
容器的/etc/mysql/conf.d
目录。通过此方式实现数据文件共用。
ncat
说起ncat我们不得不说一下Netcat。Netcat用于从TCP/UDP连接中读取或发送网络数据。cat是Linux中查看或连接文件的命令,所以netcat本意为从网络上查看文件内容。
镜像说明
-
reg.westos.org/k8s/mysql:5.7
-
reg.westos.org/k8s/xtrabackup:1.0
备份还原镜像
探针
mysql
容器探针
livenessProbe:mysqladmin ping
readinessProbe:mysql -h 127.0.0.1 -e "SELECT 1 "
附录
参考
mysql主从搭建:https://blog.csdn.net/demon7552003/article/details/124728616
xtrabackup原理:https://blog.csdn.net/ChenVast/article/details/72594055,https://blog.csdn.net/yu891203/article/details/106758822
ncat详细介绍:https://blog.csdn.net/demon7552003/article/details/117162103
解决K8S/openshift等限制以root账户运行问题
Dockerfile