disgare 的博客
首页
博客
分类
标签
首页
博客
分类
标签
  • 网络

    • 计算机网络学习笔记
    • 网络安全相关
    • 域名和子网掩码
    • CORS 跨域资源共享
    • DNS、HTTP 与 HTTPS
    • Server-Sent Events (SSE)
    • WebSocket 长连接
  • 计算机基础

    • 操作系统 IO 相关知识
    • 操作系统学习笔记
    • 程序的机器级表示
    • 音频文件基础
    • 正则表达式相关概念
    • ffmpeg 的安装以及实现音频切分功能
    • Hex 和 Base64 编码
    • XML 的使用
  • 数据结构与算法

    • 动态规划算法学习笔记
    • 基于比较的排序算法的最坏情况下的最优下界为什么是O(nlogn)
    • 集合与数据结构学习笔记
    • 面试常见算法总结
    • 算法导论第二部分排序学习笔记
    • 算法导论第一部分学习笔记
  • Java

    • 对象之间的映射与转换
    • 反射学习笔记
    • 泛型相关概念
    • 关于 boolean 类型的坑
    • 如何使用 lambda 表达式实现排序
    • CompletableFuture 相关用法
    • CompletableFuture 源码浅要阅读
    • FutureTask 源码阅读
    • Guava 常用 API
    • Guava 源码阅读:Multimap 相关
    • Jackson 的各种使用
    • Java 的 Excel 相关操作
    • java 的常见性能问题分析以及出现场景
    • java 基础知识
    • JAVA 枚举的基础和原理
    • Java 图片文件上传下载处理
    • Java 序列化
    • Java 异常
    • Java 语法糖
    • Java 中关于字符串处理的常用方法
    • Java 中强、软、弱、虚引用
    • JAVA 注解小结
    • Java Http 访问框架
    • Java Stream 的使用
    • Java8 新特性
    • netty 学习笔记
    • Scanner 的各种用法
    • Servlet 学习笔记
    • String、StringBuffer、StringBuilder 学习笔记
  • JVM

    • 虚拟机执行子系统
    • JVM 自动内存管理
    • Linux 中 JVM 常用工具以及常见问题解决思路
  • Linux

    • crontab 表达式
    • Linux 常见命令
    • Linux 文件系统
  • 中间件

    • 关于定时任务原理
    • 详解 kafka
    • ES 搜索引擎
    • flink 提交流程
    • Grape-RAG
    • Hadoop 基础原理
  • 多线程

    • 多线程基础学习笔记
    • 简单了解并发集合
    • 如何手写单例
    • 深入理解 java 多线程安全
    • 生产者消费者问题
    • 线程池作用、用法以及原理
    • AQS 组件
    • ThreadLocal 原理以及使用
  • 非关系型数据库

    • Redis 集群
    • Redis 数据结构、对象与数据库
    • Redis 学习笔记
  • 关系型数据库

    • B+ 树的插入、删除和数据页分裂机制
    • MySQL 的 binglog、redolog、undolog
    • MySQL 的记录存储结构、存储引擎与 Buffer Pool
    • MySQL 基本的特性
    • MySQL 开发规范
    • MySQL 事务与锁与 MVCC
    • MySQL 数据类型、字符集相关内容
    • MySQL 索引与索引优化
    • PostgreSQL 更新数据时 HOT优化
    • PostgreSQL 相关用法
  • Python

    • Python 基础语法
    • Python 学习
  • Spring 项目

    • Lombok 的常用注解
    • maven 小结
    • MyBatis 框架的使用
    • MyBatis 重要知识点总结
    • MybatisPlus 的使用
    • Spring 框架基础使用
    • Spring 事务相关
    • Spring IOC 的原理及源码
    • Spring AOP 的使用和原理
    • SpringBoot 的原理
    • SpringBoot 基础使用
    • SpringWeb 重要知识点
  • 分布式

    • 初步了解 docker
    • 从 ACID 到 BASE 事务处理的实现
    • 访问远程服务
    • 分布式 id
    • 分布式缓存相关问题
    • 分布式集群理论和分布式事务协议
    • 分布式架构的观测
    • 分布式一致性算法
    • 负载均衡 Load Balancing
    • 关于分布式系统 RPC 中高可用功能的实现
    • 集群间数据同步的目的
    • 三高问题下的系统优化
    • 数据库分库分表
    • 详解 Spring Cloud
    • Dubbo 基础概念
    • Gossip 协议
    • nginx 学习笔记
    • Protobuf 通信协议
    • Zookeeper 基础学习
  • 架构设计

    • 参数校验与异常处理
    • 抽象方法与设计模式
    • 代码整洁之道
    • 权限系统设计
    • 用低内存处理大量数据
    • 设计模式——策略模式
    • 设计模式——过滤器模式在 Spring 中的实践
    • 状态模式
    • 统一结果返回
    • 为什么要打日志?怎么打日志?打什么日志?
    • 运维监控常见指标含义
    • 资深研发进阶
      • 常见技术问题
        • 数据一致性
      • 数据可靠性
        • 高可用与容错
        • 性能与扩展性
        • 数据存储与访问
        • 可观测性与安全性
      • 遇到线上问题时
    • DDD 架构学习笔记
    • Java 常用的规则引擎
    • MVC 架构学习笔记
  • AI

    • 如何编写 Prompt
    • Agent 工程架构
    • LLM 相关内容
    • NLP 相关知识
    • vibe coding 最佳实践
    • windows 下 ollama 迁移到 D 盘
  • 开发工具

    • 如何画时序图、流程图、状态流转图
    • excel 关于 =vlookup 的用法
    • git 的学习以及使用
    • IDEA 插件推荐
    • IDEA 常用快捷键以及调试
    • Shell 脚本
    • swagger 的使用
  • 前端

    • 简单了解前端页面开发
    • 伪静态是什么
    • GitHub Pages 部署教程
    • Vercel 部署教程
    • vue-admin-template 简单使用
    • VuePress 博客搭建指南
  • 项目

    • 面试刷题网——技术方案
    • 影视资源聚合站——技术方案
  • 问题记录

    • 定时任务单线程消费 redis 中数据导致消费能力不足
    • 提供可传递的易受攻击的依赖项
    • Liteflow 在 SpringBoot 启动时无法注入组件问题 couldn‘t find chain with the id[THEN(NodeComponent)]
  • 金融

    • 股票分析——关于电力
    • 股票技术面——量价关系
    • 股票技术面——盘口
    • 股票技术面——基础
    • 基础的金融知识
    • 基金与股票
    • 韭菜的自我总结
    • 聊聊价值投资
  • 其他

    • 程序员职场工作需要注意什么
    • 创业全链路SOP:从灵光一现到系统化增长的实战指南
    • 观罗翔讲刑法随笔
    • 价格和价值
    • 立直麻将牌效益理论
    • 梅花易数学习笔记
    • 压力管理
2025-08-28
架构设计
目录

资深研发进阶

一个菜鸟后端开发工程师进阶到资深开发的评判标准之一就是是否拥有工程化思维,因此这篇博文总结一下工作时的常见技术问题,以及资深研发应该如何考虑一个需求

# 常见技术问题

做一个系统,在实现功能后常常会遇到以下情况,这种时候需要考虑这些情况是否需要处理,对业务影响是什么:

# 数据一致性

  • 原子性保证:业务中某个操作是否需要完整执行或完全回滚
  • 分布式一致性:多节点间数据同步的一致性模型选择(强一致、最终一致等),
  • 中间态数据不一致:需要考虑业务场景中,中间态时数据不一致是否对业务有影响
  • 双写一致性:系统迁移或灰度时双写场景的数据同步问题,需要考虑数据丢失的风险,是否需要采用事务型双写或异步双写,数据迁移时如何保证平滑切换
  • 事务管理:跨服务、跨数据库的分布式事务处理,是否引入 seate 框架,选用何种模式(AT、TCC、SAGA 等),事务执行过程中数据对其他事务是否可见
  • 顺序保证:消息顺序性、操作顺序性

# 数据可靠性

  • 数据丢失防护:异步写入时的持久化保证,可以使用如消息队列持久化、定时任务重试等
  • 数据去重:如何防止重复写入或重复消费,一般可以使用分布式锁+表内唯一索引来实现
  • 并发控制:乐观锁、悲观锁、分布式锁

# 高可用与容错

  • 单点故障:识别并消除系统中的单点,所谓单点是指这个组件如果失败,会导致整个系统失败,因此需要引入冗余组件,不只是一个机器可能会挂机,可能一个机房也会挂机
  • 故障转移:主从切换、故障检测与自动恢复机制,可以参考心跳检测、gossip、一致性协议(选主)、故障转移策略这个流程来处理
  • RPC 高可用设计:熔断、限流、降级、超时、负载均衡、失败策略(重试、快速失败、访问集群中其他机器等等)

# 性能与扩展性

  • 水平扩展能力:无状态设计、数据分片策略
  • 缓存策略:缓存层级、缓存更新策略、缓存穿透/击穿/雪崩等分布式缓存常见问题如何处理
  • 数据库性能:索引设计、查询优化、读写分离
  • 性能优化:判断动作是否可以异步处理,比如使用消息队列削峰填谷等;是否可以批量操作,合并请求;是否可以使用缓存,减少数据库压力

# 数据存储与访问

  • 分库分表:分片键选择、是否需要考虑扩容方案、跨片查询(一般是存到 es 中)
  • 冷热数据分离:归档策略、存储成本优化
  • 数据备份与恢复:备份频率、恢复时间目标(RTO)、恢复点目标(RPO)
  • 多数据源管理:数据源路由、读写分离的延迟处理
  • 大数据量处理:分页策略、游标方案
  • 容量规划:流量预估、资源评估,可以参考历史业务做判断

# 可观测性与安全性

  • 日志、监控、告警:日志级别、日志聚合、链路追踪的 TraceID、核心指标监控(QPS、延迟、错误率)、告警阈值设置、分布式调用链跟踪
  • 灰度发布:流量控制、快速回滚能力;需要考虑向前向后兼容、接口版本管理
  • 故障演练:混沌工程(通过主动注入故障来验证系统韧性的实验性方法)、灾难恢复演练、事先定好故障预案等

# 遇到线上问题时

遇到线上问题时,如果不是你负责的项目,可能无法很快定位问题,因此一个资深研发会遵循以下 SOP,来快速处理问题

1,如何发现问题

  • 系统的监控指标和日志,如 CPU 占用率、内存占用率、请求响应时间等,是否存在异常
  • 用户反馈、营运同学、合作方告知有异常发生。出现这种情况,说明系统可观测性做的不好,理论上我们应该在用户之前感知到这个问题

2,如何定位问题

理论上我们应该先定位后止损,但是也存在长时间问题定位不到的情况,这时候需要根据具体情况来判断是否需要紧急处理。一般问题都是根据日志、监控、报警来定位的,这就需要考虑一个系统的可观测性做的是否完善。一个系统的可观测性是根据日志、追踪、度量来评估的

3,如何止损

  • 第一时间通知相关人员、上级,告知问题发生,询问是否需要紧急处理
  • 如果线上需要很快处理问题,请在下面5种方法中选择一个来紧急处理:重启、扩容、关开关、回滚、摘流

4,如何修复

改代码重新上线,根据监控系统确认问题是否解决

5,扩展分析

需要横向比较一下,所负责的系统中是否存在其他类似问题。比如线上出现问题是,锁粒度太大了,你就需要考虑整个系统中是否有其他地方所使用的事务锁粒度大,是否可以优化一下锁的粒度

#系统优化
最后更新: 2/25/2026, 8:20:00 AM
运维监控常见指标含义
DDD 架构学习笔记

← 运维监控常见指标含义 DDD 架构学习笔记→

最近更新
01
vibe coding 最佳实践
02-24
02
立直麻将牌效益理论
02-23
03
伪静态是什么
02-08
更多文章>
Theme by Vdoing
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式