disgare 的博客
首页
博客
分类
标签
首页
博客
分类
标签
  • 网络

    • 计算机网络学习笔记
    • 网络安全相关
    • 域名和子网掩码
    • CORS 跨域资源共享
    • DNS、HTTP 与 HTTPS
    • Server-Sent Events (SSE)
    • WebSocket 长连接
  • 计算机基础

    • 操作系统 IO 相关知识
    • 操作系统学习笔记
    • 程序的机器级表示
    • 音频文件基础
    • 正则表达式相关概念
    • ffmpeg 的安装以及实现音频切分功能
    • Hex 和 Base64 编码
    • XML 的使用
  • 数据结构与算法

    • 动态规划算法学习笔记
    • 基于比较的排序算法的最坏情况下的最优下界为什么是O(nlogn)
    • 集合与数据结构学习笔记
    • 面试常见算法总结
    • 算法导论第二部分排序学习笔记
    • 算法导论第一部分学习笔记
  • Java

    • 对象之间的映射与转换
    • 反射学习笔记
    • 泛型相关概念
    • 关于 boolean 类型的坑
    • 如何使用 lambda 表达式实现排序
    • CompletableFuture 相关用法
    • CompletableFuture 源码浅要阅读
    • FutureTask 源码阅读
    • Guava 常用 API
    • Guava 源码阅读:Multimap 相关
    • Jackson 的各种使用
    • Java 的 Excel 相关操作
    • java 的常见性能问题分析以及出现场景
    • java 基础知识
    • JAVA 枚举的基础和原理
    • Java 图片文件上传下载处理
    • Java 序列化
    • Java 异常
    • Java 语法糖
    • Java 中关于字符串处理的常用方法
    • Java 中强、软、弱、虚引用
    • JAVA 注解小结
    • Java Http 访问框架
    • Java Stream 的使用
    • Java8 新特性
    • netty 学习笔记
    • Scanner 的各种用法
    • Servlet 学习笔记
    • String、StringBuffer、StringBuilder 学习笔记
  • JVM

    • 虚拟机执行子系统
    • JVM 自动内存管理
    • Linux 中 JVM 常用工具以及常见问题解决思路
  • Linux

    • crontab 表达式
    • Linux 常见命令
    • Linux 文件系统
  • 中间件

    • 关于定时任务原理
    • 详解 kafka
    • ES 搜索引擎
    • flink 提交流程
    • Grape-RAG
    • Hadoop 基础原理
  • 多线程

    • 多线程基础学习笔记
    • 简单了解并发集合
    • 如何手写单例
    • 深入理解 java 多线程安全
    • 生产者消费者问题
    • 线程池作用、用法以及原理
    • AQS 组件
    • ThreadLocal 原理以及使用
  • 非关系型数据库

    • Redis 集群
    • Redis 数据结构、对象与数据库
    • Redis 学习笔记
  • 关系型数据库

    • B+ 树的插入、删除和数据页分裂机制
    • MySQL 的 binglog、redolog、undolog
    • MySQL 的记录存储结构、存储引擎与 Buffer Pool
    • MySQL 基本的特性
    • MySQL 开发规范
    • MySQL 事务与锁与 MVCC
    • MySQL 数据类型、字符集相关内容
    • MySQL 索引与索引优化
    • PostgreSQL 更新数据时 HOT优化
    • PostgreSQL 相关用法
  • Python

    • Python 基础语法
    • Python 学习
  • Spring 项目

    • Lombok 的常用注解
    • maven 小结
    • MyBatis 框架的使用
    • MyBatis 重要知识点总结
    • MybatisPlus 的使用
    • Spring 框架基础使用
    • Spring 事务相关
    • Spring IOC 的原理及源码
    • Spring AOP 的使用和原理
    • SpringBoot 的原理
    • SpringBoot 基础使用
    • SpringWeb 重要知识点
  • 分布式

    • 初步了解 docker
    • 从 ACID 到 BASE 事务处理的实现
    • 访问远程服务
    • 分布式 id
    • 分布式缓存相关问题
    • 分布式集群理论和分布式事务协议
    • 分布式架构的观测
    • 分布式一致性算法
    • 负载均衡 Load Balancing
    • 关于分布式系统 RPC 中高可用功能的实现
    • 集群间数据同步的目的
      • 集群间数据同步的目的
      • 集群间数据同步方式
      • 出现主机挂机如何崩溃恢复
      • 持久化机制
    • 三高问题下的系统优化
    • 数据库分库分表
    • 详解 Spring Cloud
    • Dubbo 基础概念
    • Gossip 协议
    • nginx 学习笔记
    • Protobuf 通信协议
    • Zookeeper 基础学习
  • 架构设计

    • 参数校验与异常处理
    • 抽象方法与设计模式
    • 代码整洁之道
    • 权限系统设计
    • 用低内存处理大量数据
    • 设计模式——策略模式
    • 设计模式——过滤器模式在 Spring 中的实践
    • 状态模式
    • 统一结果返回
    • 为什么要打日志?怎么打日志?打什么日志?
    • 运维监控常见指标含义
    • 资深研发进阶
    • DDD 架构学习笔记
    • Java 常用的规则引擎
    • MVC 架构学习笔记
  • AI

    • 如何编写 Prompt
    • Agent 工程架构
    • LLM 相关内容
    • NLP 相关知识
    • vibe coding 最佳实践
    • windows 下 ollama 迁移到 D 盘
  • 开发工具

    • 如何画时序图、流程图、状态流转图
    • excel 关于 =vlookup 的用法
    • git 的学习以及使用
    • IDEA 插件推荐
    • IDEA 常用快捷键以及调试
    • Shell 脚本
    • swagger 的使用
  • 前端

    • 简单了解前端页面开发
    • 伪静态是什么
    • GitHub Pages 部署教程
    • Vercel 部署教程
    • vue-admin-template 简单使用
    • VuePress 博客搭建指南
  • 项目

    • 面试刷题网——技术方案
    • 影视资源聚合站——技术方案
  • 问题记录

    • 定时任务单线程消费 redis 中数据导致消费能力不足
    • 提供可传递的易受攻击的依赖项
    • Liteflow 在 SpringBoot 启动时无法注入组件问题 couldn‘t find chain with the id[THEN(NodeComponent)]
  • 金融

    • 股票分析——关于电力
    • 股票技术面——量价关系
    • 股票技术面——盘口
    • 股票技术面——基础
    • 基础的金融知识
    • 基金与股票
    • 韭菜的自我总结
    • 聊聊价值投资
  • 其他

    • 程序员职场工作需要注意什么
    • 创业全链路SOP:从灵光一现到系统化增长的实战指南
    • 观罗翔讲刑法随笔
    • 价格和价值
    • 立直麻将牌效益理论
    • 梅花易数学习笔记
    • 压力管理
2025-06-18
架构设计
目录

集群间数据同步的目的

# 集群间数据同步的目的

主要服务于高可用/灾备、低延迟访问、负载均衡、扩展这三大核心目标:

1,高可用性与灾难恢复,这是最核心的驱动力。当一个集群因硬件故障、网络中断、软件错误、自然灾害或人为失误而不可用时,位于其他位置的备份集群可以接管服务,确保业务连续性 2,读写分离与水平扩展,当单个集群的读写负载达到瓶颈时,将只读流量分散到多个包含相同数据副本的集群上,可以分担压力,提高系统整体的吞吐量和处理能力 3,低延迟访问:如 CDN、异地机房这些,虽然看上去和第二点类似,但是此处更倾向与将数据放在离用户更进的地方,以及冷热分离

# 集群间数据同步方式

数据同步的本质是将变更从一个集群传播到其他集群,不同技术根据其设计目标(CP 或者 AP、吞吐量、延迟敏感性)采用不同策略

1,redis:默认异步同步,主节点推送写命令(或 RDB 快照 + 增量命令,只有在第一次连接时才会执行)到从节点,增量同步时默认采用异步复制,机器维护和从机间的心跳检测,心跳检测是带有复制偏移量的

主机可配置至少有几个从机链接,以及和从机间 gap 最大允许多少。如果没有符合条件的从机,那么主机会拒绝写入请求。底层原理一般是异步同步写入指令以及心跳检测构建成的。如此设计的哲学是 redis 面向高可用的场景,需要处理容灾以及高 qps 等问题,因此异步写入数据,但是拒绝写入策略又在高可用性下维护了集群的一致性

在去中心化集群部署时从节点只用于崩溃恢复,哨兵模式或者主从部署时可以用于读写分离

2,MySQL:底层基于 Binlog,主库记录数据变更,在事务提交时主库主动告知从库,从库通过 I/O 线程拉取日志,SQL 线程重放变更

db 可以配置异步同步、半同步和全同步,他们主要是返回用户请求的时机不一样,全同步是所有从机返回应答后才回复,半同步是某个从机返回应答后才回复,全同步则是所有从机回复后才能回复用户

3,kafka:kafka 主分区接受到消息后,从副本会不断主动拉取主副本的消息,并且给主分区同步自己的偏移量以维护高水位 HW 这个值

kafka 如此设计主要是为了保证高吞吐量,主动同步给从副本可能会影响主副本性能。用户可以配置 ack 机制设置不同的返回时机,比如默认的是确认主分区收到消息后才返回,可以设置异步返回,也可以设置 kafka 同步完所有的副本后才返回

4,es:es 同步方式和 mysql 类似,可能他们都是存数据的地方吧,主分片执行完事务后会主动同步从分片

es 也可以配置写入策略,默认是大多数分片写入后才返回用户,也可以配置异步返回或者全同步

5,zk:集群间使用 zab 协议的消息同步来保证数据的一致性,是为数不多的 cp 架构,zab 的使用也类似 poxas 算法,同步的目的是为了崩溃恢复和抗住更多读请求压力

具体做法为主机向从机发事务和准备提交命令,一半以上从机返回 ack 后主机发送执行命令,然后返回用户

综上,数据同步按其目的会大致分为:

  • 1,阻塞半同步(MySQL、es)
  • 2,阻塞全同步(zk 使用 zab 保证全同步、MySql 的组同步、redis 高版本可设置全同步,一般都是基于 Poaxs 算法实现)
  • 3,异步同步+心跳检测(redis)
  • 4,等待从机同步(kafka)

# 出现主机挂机如何崩溃恢复

如果集群以崩溃恢复为目的,出现了主机挂机,他们后续会如何操作呢?

1,redis:redis 一般有三种集群部署机制,每种崩溃恢复都不太一样

  • 主从:raft
  • 哨兵:大部分集群检测到主机下线后,使用 raft 算法在哨兵集群中选出一个主机,过程就是按照一定的优先级(提案 ID 优先、机器编号优先、纪元优先等策略)加半数选举机制选择,主机来处理故障转移等操作。故障转移会优先选择偏移量较大的机器作为主机
  • cluster:多主多从,某个主机下的从机检测到主机宕机后(使用 gossip 协议检测),会使用 raft 算法直接选出一个主机

2,MySQL:MySQL 中不同的部署方式会有不同的崩溃恢复机制

  • 如果是传统主从复制(异步/半同步),会检测是否有 VIP 或 Proxy,如果有则 VIP 漂移到从库,如果没有则需要手动执行 CHANGE MASTER 切换

  • 如果是组复制,则参考了 paxos 协议 在这里插入图片描述 3,kafka:崩溃恢复有两种机制

  • 老:znode 机制。需要依靠 zk,从机在检测到主副本挂了后,会向 zk 集群申请自己为 controller,申请成功,则会进行检测主副本是否存活、选定新副本为主副本等操作。故障转移会优先选择 ISR 中的机器,如果没有会选择偏移量最大的机器或者等待之前的主机恢复

  • 新:kraft 机制,不用依靠 zk 了,像 redis 一样,内部使用 raft 选出一个机器为 controller,执行后续操作

4,es:基于 Raft 变种做崩溃恢复,和 MySQL 类似 在这里插入图片描述

5,zk:使用 zab 协议的崩溃恢复机制,zab 抄袭了 paxos 的思想,也是每个机器会尝试发送提案,提案 ID 较大(如果提案 ID 一样则比较机器 ID)的选择为新主机,后续进行数据同步的操作

综上,大多数集群的容灾机制,都使用了 paxos 算法或者其变种算法(raft、zab)

# 持久化机制

各个数据库和中间件都有持久化机制,持久化可以保证机器挂掉后,重启可以恢复到之前正确的状态。我们来比较一下他们有什么不一样的地方

1,redis:redis 一般用于缓存,其持久化机制为 rdb 和 aof

  • rdb 为内存二进制快照,适合全量备份,落库时机为每 x 秒内有 y 条数据变更则落库,可用于在集群间同步数据和崩溃恢复
  • aof 为逻辑语句,落库时机为执行完一条语句后就会落库,可同步增量数据。由于 aof 后续会记录很多没用的数据,因此 redis 会有 aof 重写优化

2,MySQL:MySQL 用于记录数据,主要日志为 binlog、redolog、undolog 和 db 里本身的数据,除了同步数据外他们还需要支持回滚和重做等操作

  • undolog 和原本数据落库时机为脏页回刷时,日志内容为整条数据
  • binlog 和 redolog 落库时机默认为事务提交时(双1设置),binlog 日志内容默认为行记录,redolog 则是物理日志,默认内容为 xxx 事务在将 xxx 改成了 xxx

3,kafka:消息按分区存储为顺序追加的日志文件,每个 Segment 包含一个数据文件和索引文件,写入时先追加到 Page Cache,由操作系统异步刷盘

4,es:数据写入先到内存缓冲区,定期刷新到文件系统缓存,再通过 fsync 刷盘,事务日志记录未提交的操作,默认每次请求同步写入

5,zk:所有写操作顺序追加到磁盘文件,每次写入后同步刷盘,同时会定期将内存数据树序列化到磁盘,用于快速恢复

在这里插入图片描述

综上,持久化机制就是记录物理或者逻辑日志然后同步或者异步或者定时刷盘

#高可用#灾备#负载均衡
最后更新: 2/28/2026, 11:31:29 AM
关于分布式系统 RPC 中高可用功能的实现
三高问题下的系统优化

← 关于分布式系统 RPC 中高可用功能的实现 三高问题下的系统优化→

最近更新
01
vibe coding 最佳实践
02-24
02
立直麻将牌效益理论
02-23
03
伪静态是什么
02-08
更多文章>
Theme by Vdoing
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式