关于MySQL拓扑关系的梳理

875次阅读 | 发布于4年以前

关于MySQL的拓扑关系，最近是比较困扰我的，主要是因为最近在思考重构元数据层面的一些东西，发现原来的一些设计方式已经不能够支持现在的业务特点了。

如果从一个更整体的角度来看待数据库的元数据，其实它是有一个生命周期管理的模型，而在这个模型中，我们势必会有所侧重。

在做后面的说明之前，先说下元数据的维度设计。

我把当前的现状做了下梳理，发现问题还真不少，而且都是硬伤。

l 元数据遗漏和不一致：对于ORM层的操作直接暴露，导致元数据会有手工变更的情况，出现数据和变更混乱

l 元数据关联关系维护：多表关联的配置关系在功能扩展时难以维护，需要统一开放相关的API

l 元数据流程维护：缺少相关的流程维护，应该基于业务场景驱动，需要设计相关的元数据流程

l 元数据维度建设：元数据维度建设单一，目前主要为实例和部分集群和数据库，缺少主机，应用层信息，集群和实例层信息没有关联起来

l 元数据查询维度：元数据查询的维度单一，信息可以更加全面，参考维度为：主机，实例，集群，应用，数据库

对于复制拓扑的部分，在早期的时候使用了master-slaves的模式，即所有的复制关系都是一组一组的，类似下面的方式。

100.130.124.41	4306	100.130.124.104	4306
100.130.124.90	4307	100.130.124.86	4307
100.130.124.55	4306	100.130.124.100	4306
100.130.124.100	4306	100.130.124.102	4306

这种模式带来了一些明显的问题： 1. 不支持域名 2. 一主多从的关系不够清晰 3. 级联实例的关系不好体现 4. 基于双主模式的复制拓扑难以体现 5. 读写分离的关系不好体现 6. 不支持跨机房容灾的复制关系所以这些问题抛出来，也算是自我革命，整体上来看这种关系的维护是比较复杂的，如果碰到一些略微复杂的场景，总是会有一种无力感。比如这种复制关系，正常的一主一从做高可用，流转节点支撑后面的数据业务，这种通过单纯的主从模式无法体现。 ![](https://oss-cn-hangzhou.aliyuncs.com/codingsky/cdn/img/opt/1/90746d7b7d08446829fa005984553ef7) 比如这种烟囱架构，不说它好与不好，但就从复制拓扑关系层面，单纯的主从模式也是难以支撑的。 ![](https://oss-cn-hangzhou.aliyuncs.com/codingsky/cdn/img/opt/1/1454447260ae3c43e3202ebc6d2b7630) 所以进一步拆分，可以提炼下，我们常见的数据库的使用形式大体有如下的几类： - 单实例（SingleDB） - 主从实例（Master-Slaves） - 高可用集群（HA_cluster） - 分布式集群（Proxy_Cluster）对于这种模式，我们先从表格化的关系梳理开始，先不考虑数据库层的实现。如果是这种复制拓扑关系，基本上能够解决我们所说的拓扑关系。 ![](https://oss-cn-hangzhou.aliyuncs.com/codingsky/cdn/img/opt/1/ffdf9b591aac8b2e40ec1e6c398c6f5c) MySQL 8.0有个特性叫做replicaSet,这个特性的名字给了我新的启发，那就是我们可以按照复制集的角度去重新看待原来的拓扑关系。比如复制集repl-001,包含一主两从，repl-003复制集，它是一主一从，同时包含一套级联复制环境，可以从repl-004得到明细的复制关系,repl-002是单实例环境，没有从库。这种设计能够基本上解决我们的一些理解上面的偏差，但是在设计层面其实是不够好的。一方面是这种关系的维护比较生硬，如果是一主多从的环境，单纯字段的扩展是不可行的，同时对于slave1,slave2,slave3等的逻辑判断简直会让人疯掉。所以在这个基础上可以再做一些改进，改进为如下的形式，我们把复制类型做了简化，同时对复制集做了进一步的标识，在末尾补充一个字段为dr_flag是标识是否为跨机房容灾。从这个复制关系来看，整体上是OK的，能够基本实现我们所说的那几个问题。 ![](https://oss-cn-hangzhou.aliyuncs.com/codingsky/cdn/img/opt/1/ec941712273fdaea707d5c578eed4fce) 我补充一些说明： - 单实例：repl_type为“M”,slave_ip为空 - 一主一从：repl_type为“M-S”,master_ip，slave_ip不为空 - 一主多从：repl_type为“M-S”,master_ip有多个slave_ip，分为多行存储，repl_code不变 - 级联从库：repl_type为“R-S”,master_ip,slave_ip不为空，dr_flag为N,和上游的主从配置共享repl_code - 双主模式：repl_type为“M-S”,分两行存储，master_ip,slave_ip交叉，repl_code共享在这个基础上，我们来重新审视下原来提出的问题。 1. 不支持域名 2. 一主多从的关系不够清晰 3. 级联实例的关系不好体现 4. 基于双主模式的复制拓扑难以体现 5. 读写分离的关系不好体现 6. 不支持跨机房容灾的复制关系其实2，3，4，6是可以支持的，而对于域名服务的部分，目前看和复制拓扑没有直接的关系，因为域名的模式本质上提供的是高可用服务，这个在高可用层可以补充。高可用层和集群层的整理差不多了，稍后发送出来。