disgare 的博客
首页
博客
分类
标签
首页
博客
分类
标签
  • 网络

    • 计算机网络学习笔记
    • 网络安全相关
    • 域名和子网掩码
    • CORS 跨域资源共享
    • DNS、HTTP 与 HTTPS
    • Server-Sent Events (SSE)
    • WebSocket 长连接
  • 计算机基础

    • 操作系统 IO 相关知识
    • 操作系统学习笔记
    • 程序的机器级表示
    • 音频文件基础
    • 正则表达式相关概念
    • ffmpeg 的安装以及实现音频切分功能
    • Hex 和 Base64 编码
    • XML 的使用
  • 数据结构与算法

    • 动态规划算法学习笔记
    • 基于比较的排序算法的最坏情况下的最优下界为什么是O(nlogn)
    • 集合与数据结构学习笔记
    • 面试常见算法总结
    • 算法导论第二部分排序学习笔记
    • 算法导论第一部分学习笔记
  • Java

    • 对象之间的映射与转换
    • 反射学习笔记
    • 泛型相关概念
    • 关于 boolean 类型的坑
    • 如何使用 lambda 表达式实现排序
    • CompletableFuture 相关用法
    • CompletableFuture 源码浅要阅读
    • FutureTask 源码阅读
    • Guava 常用 API
    • Guava 源码阅读:Multimap 相关
    • Jackson 的各种使用
    • Java 的 Excel 相关操作
    • java 的常见性能问题分析以及出现场景
    • java 基础知识
    • JAVA 枚举的基础和原理
    • Java 图片文件上传下载处理
    • Java 序列化
    • Java 异常
    • Java 语法糖
    • Java 中关于字符串处理的常用方法
    • Java 中强、软、弱、虚引用
    • JAVA 注解小结
    • Java Http 访问框架
    • Java Stream 的使用
    • Java8 新特性
    • netty 学习笔记
    • Scanner 的各种用法
    • Servlet 学习笔记
    • String、StringBuffer、StringBuilder 学习笔记
  • JVM

    • 虚拟机执行子系统
    • JVM 自动内存管理
    • Linux 中 JVM 常用工具以及常见问题解决思路
  • Linux

    • crontab 表达式
    • Linux 常见命令
    • Linux 文件系统
  • 中间件

    • 关于定时任务原理
      • 计算机是怎么计时的
      • 关于本地定时任务实现
        • 小根堆实现
        • 时间轮实现
      • 关于分布式任务的实现
        • 基础配置讲解
        • 底层原理讲解
        • 如何管理触发器所记录的时间
    • 详解 kafka
    • ES 搜索引擎
    • flink 提交流程
    • Grape-RAG
    • Hadoop 基础原理
  • 多线程

    • 多线程基础学习笔记
    • 简单了解并发集合
    • 如何手写单例
    • 深入理解 java 多线程安全
    • 生产者消费者问题
    • 线程池作用、用法以及原理
    • AQS 组件
    • ThreadLocal 原理以及使用
  • 非关系型数据库

    • Redis 集群
    • Redis 数据结构、对象与数据库
    • Redis 学习笔记
  • 关系型数据库

    • B+ 树的插入、删除和数据页分裂机制
    • MySQL 的 binglog、redolog、undolog
    • MySQL 的记录存储结构、存储引擎与 Buffer Pool
    • MySQL 基本的特性
    • MySQL 开发规范
    • MySQL 事务与锁与 MVCC
    • MySQL 数据类型、字符集相关内容
    • MySQL 索引与索引优化
    • PostgreSQL 更新数据时 HOT优化
    • PostgreSQL 相关用法
  • Python

    • Python 基础语法
    • Python 学习
  • Spring 项目

    • Lombok 的常用注解
    • maven 小结
    • MyBatis 框架的使用
    • MyBatis 重要知识点总结
    • MybatisPlus 的使用
    • Spring 框架基础使用
    • Spring 事务相关
    • Spring IOC 的原理及源码
    • Spring AOP 的使用和原理
    • SpringBoot 的原理
    • SpringBoot 基础使用
    • SpringWeb 重要知识点
  • 分布式

    • 初步了解 docker
    • 从 ACID 到 BASE 事务处理的实现
    • 访问远程服务
    • 分布式 id
    • 分布式缓存相关问题
    • 分布式集群理论和分布式事务协议
    • 分布式架构的观测
    • 分布式一致性算法
    • 负载均衡 Load Balancing
    • 关于分布式系统 RPC 中高可用功能的实现
    • 集群间数据同步的目的
    • 三高问题下的系统优化
    • 数据库分库分表
    • 详解 Spring Cloud
    • Dubbo 基础概念
    • Gossip 协议
    • nginx 学习笔记
    • Protobuf 通信协议
    • Zookeeper 基础学习
  • 架构设计

    • 参数校验与异常处理
    • 抽象方法与设计模式
    • 代码整洁之道
    • 权限系统设计
    • 用低内存处理大量数据
    • 设计模式——策略模式
    • 设计模式——过滤器模式在 Spring 中的实践
    • 状态模式
    • 统一结果返回
    • 为什么要打日志?怎么打日志?打什么日志?
    • 运维监控常见指标含义
    • 资深研发进阶
    • DDD 架构学习笔记
    • Java 常用的规则引擎
    • MVC 架构学习笔记
  • AI

    • 如何编写 Prompt
    • Agent 工程架构
    • LLM 相关内容
    • NLP 相关知识
    • vibe coding 最佳实践
    • windows 下 ollama 迁移到 D 盘
  • 开发工具

    • 如何画时序图、流程图、状态流转图
    • excel 关于 =vlookup 的用法
    • git 的学习以及使用
    • IDEA 插件推荐
    • IDEA 常用快捷键以及调试
    • Shell 脚本
    • swagger 的使用
  • 前端

    • 简单了解前端页面开发
    • 伪静态是什么
    • GitHub Pages 部署教程
    • Vercel 部署教程
    • vue-admin-template 简单使用
    • VuePress 博客搭建指南
  • 项目

    • 面试刷题网——技术方案
    • 影视资源聚合站——技术方案
  • 问题记录

    • 定时任务单线程消费 redis 中数据导致消费能力不足
    • 提供可传递的易受攻击的依赖项
    • Liteflow 在 SpringBoot 启动时无法注入组件问题 couldn‘t find chain with the id[THEN(NodeComponent)]
  • 金融

    • 股票分析——关于电力
    • 股票技术面——量价关系
    • 股票技术面——盘口
    • 股票技术面——基础
    • 基础的金融知识
    • 基金与股票
    • 韭菜的自我总结
    • 聊聊价值投资
  • 其他

    • 程序员职场工作需要注意什么
    • 创业全链路SOP:从灵光一现到系统化增长的实战指南
    • 观罗翔讲刑法随笔
    • 价格和价值
    • 立直麻将牌效益理论
    • 梅花易数学习笔记
    • 压力管理
2025-04-27
中间件
目录

关于定时任务原理

今天来聊一下工作中经常使用的定时任务的底层实现原理

# 计算机是怎么计时的

计算机内部使用多种方式来计时,主要依赖于硬件时钟(如实时时钟 RTC)和操作系统中的软件时钟机制

1,硬件时钟(Real-Time Clock,RTC):这是一个位于主板上的芯片,即使在计算机关闭或断电的情况下也能保持时间信息。RTC 通常由一个小电池供电,确保它能够在没有外部电源的情况下继续运行。当计算机启动时,操作系统会读取 RTC 的时间设置,并将其用作系统时间的基础。 2,系统时钟(System Clock):这是操作系统内核维护的一个计数器,用于跟踪自某个固定点(通常是系统的启动时间)以来经过的时间。系统时钟的精度取决于系统的时钟中断频率,常见的频率有100Hz、1024Hz等,这意味着每秒发生100次或1024次中断。每次中断时,操作系统都会更新其内部的时间记录 3,时间戳(Timestamps):应用程序经常需要知道当前的时间或者记录事件发生的具体时间。这个在工作中用的很多就不过多赘述 4,网络时间协议(NTP):为了确保不同设备之间的时间同步,许多计算机通过网络时间协议(NTP)与时间服务器同步时间。NTP 允许计算机从互联网上的时间服务器获取准确的时间信息,并根据这些信息调整自己的时钟,从而实现全球范围内的时钟同步

通过上述机制的结合,计算机能够准确地记录和显示时间,支持各种需要精确时间的应用程序和服务

# 关于本地定时任务实现

这里的定时任务实现是指如何存储任务、触发器这些数据,而非如何实现系统时钟这一功能

知道了计算机如何计时后,我们就可以开始考虑计算机是如何实现定时任务了。比如我们想让计算机在 x 分钟后执行某种任务,我们可以会起一个线程,每分钟去判断一次当前时间和目标时间是否一致,如果一致就执行任务。但是这么做会占用一个线程资源,很多个任务就会占用很多线程资源,我们应该将这些资源用一个线程来管理

怎么做呢,我们首先会想到用一些数据结构来维护这些资源,然后每隔 x 毫秒判断一下数据结构中的这些资源是否需要执行了,这里的数据结构可以使用比如小根堆、时间轮之类的

# 小根堆实现

它可以让每次写入的定时任务都按照执行时间进行排序,保证在堆顶的任务执行时间是最小的

这样在需要执行任务时,每次只需要取出堆顶的任务运行即可,所以它取出任务的效率很高

下图是 Timer 小根堆的实现,对于会将写入的任务从队列的中部通过执行时间与前一个任务做比对,一直不断的向前比较,这段逻辑在下图中的 add 方法中 请添加图片描述 这里我们需要额外考量一些业务上的问题:

后台调度定时任务的线程只有一个,我们应该使用一个线程池来执行实际业务代码,这样某个任务出错也不会影响其他任务执行,并且其他的任务也不需要依赖前置任务执行完毕后才能执行了

# 时间轮实现

时间轮这个数据结构大家可能不太熟悉,简单介绍一下:

时间轮(Time Wheel)是一种用于高效管理和调度定时任务的数据结构。它特别适用于需要处理大量定时任务的场景,时间轮的设计理念是通过将时间划分成多个槽(Slot),每个槽代表一个固定的时间间隔

当需要添加一个定时任务时,计算该任务的到期时间相对于当前时间的位置。根据到期时间,将任务插入到相应的槽中

指针每经过一个时间间隔(例如1秒)向前移动一个槽。当指针移动到某个槽时,检查该槽中的任务,并执行这些任务 在这里插入图片描述 有些同学可能要问,那如果我需要设置的时间离现在太远了,一轮根本装不下,怎么办,我总不能生成一个无限长度的轮子吧。好问题,我们可以用很多个轮子来存放资源,像时针分针秒针一样,任务资源会存放多个轮子的数据,只有所有数据都达标的时候,任务才会执行 在这里插入图片描述 时间轮通常用于实现 XX 时间后的延时任务(如定时任务、延迟 MQ 等),或周期性任务

# 关于分布式任务的实现

给大家介绍一个非常有名的 java 任务调度框架 Quartz,以此为例子来讲解一下分布式任务的实现

在 quartz 的集群解决方案里有张表 QRTZ_LOCKS(因为是分布式的所以不能只将信息存放在内存中),quartz 采用了悲观锁的方式对 triggers 表进行行加锁,以保证任务同步的正确性。一旦某一个节点上面的线程获取了该锁,那么这个 Job 就会在这台机器上被执行,同时这个锁就会被这台机器占用。同时另外一台机器也会想要触发这个任务,但是锁已经被占用了,就只能等待,直到这个锁被释放

quartz 的分布式调度策略是以数据库为边界资源的一种异步策略。各个调度器都遵守一个基于数据库锁的操作规则从而保证了操作的唯一性。quartz 用这种方式处理了最简单的分布式调度。下面再额外补充一下 quartz 的核心组件,了解了组件基本上就知道原理了

# 基础配置讲解

quartz 有几个核心的类:

1,调度器(scheduler):负责协调任务和触发器,控制任务的启动、暂停、恢复和终止 2,触发器(Trigger):保存 corn 等时间信息,保存了什么时候应该调用什么任务的信息 3,jobDetail:用来描述 Job 实现类及其它相关的静态信息,如 Job 名字、关联监听器等信息 4,Job:是一个接口,只有一个方法 void execute(JobExecutionContext context),开发者实现该接口定义运行任务

原理就是 quartz 保存任务详细信息,和触发器。我们还将他们的关联关系保存到了表中,触发器会没隔一段时间就检测是否要执行任务了,以及执行什么任务

步骤1:用户首先需要生成一个调度器工厂 SchedulerFactory,可以用下面的方式实现自己的定制化:

Properties properties=new Properties();    
properties.put("org.quartz.threadPool.class","org.quartz.simpl.SimpleThreadPool");
properties.put("org.quartz.threadPool.threadCount","10");
SchedulerFactory sf=new StdSchedulerFactory(properties);
1
2
3
4

步骤2:然后通过 getScheduler 方法从调度器工厂里得到调度器实例,首先查找有没有这样的调度器,没有的话,就生成一个,有的话直接返回。所以得到的一般是单例,即默认的调度器

步骤3:Scheduler 有一个 QuartzSchedulerThread(Thread 的子类)属性,在 scheduler 实例化的时候,实例化了一个对象,并用 ThreadExecutor 启动该线程对象。该线程就是调度线程,主要任务就是不停的获取即将被触发的触发器(默认30s调度一次)

步骤4:接下来是任务调度的部分:

Scheduler scheduler=sf.getScheduler();
scheduler.addJobListener(new TaskListener());
scheduler.scheduleJob(jobDetail, simpleTrigger);
scheduler.start();
1
2
3
4

client 通过 scheduleJob 方法将任务和触发器存储在 JobStore 中,通过 start 方法将 QuartzSchedulerThread 的 pause 状态设为 false,通知调度线程执行任务,此后调度线程不停的从 JobStore 中去取即将触发的任务

# 底层原理讲解

Quartz 的调度机制是使用了一个叫做 JobStore 的组件来存储任务和触发器

Quartz 默认使用的是 RAMJobStore,也就是内存存储,而持久化的话会用 JDBCJobStore。Quartz 的工作方式,是调度线程会定期检查触发器,判断哪些需要触发,这里有一个 nextFireTime 就保存的是下一次触发时间。这个过程可能基于优先级队列或者类似的结构,当然用时间轮也可以。当触发器触发后,会根据其调度规则(如 Cron 表达式、重复间隔等)重新计算 nextFireTime,并重新插入队列

Quartz 的集群模式是通过数据库持久化来实现的。也就是说,多个 Quartz 实例共享同一个数据库,通过数据库中的表来协调任务的状态和锁。这样,当一个节点失效时,其他节点可以接管任务,确保同一时间只有一个节点执行某个任务

# 如何管理触发器所记录的时间

当您定义一个使用 Cron 表达式的触发器时,Quartz 会首先解析这个表达式。Quartz 会根据当前时间和 Cron 表达式计算出下一个任务应该执行的具体时间点。这个时间点是一个具体的日期和时间,可以转换成时间戳,插入到优先队列中

当时一个 Cron 表达式会向优先队列中插入很多数据,难道我初始化一个任务,就向优先队列中插入十万条数据了吗?当然不会这样,Quartz 的处理方案是当指针移动到包含任务的时间槽时,任务会被执行。在任务执行时,Quartz 会再次计算下一个执行时间点,并将新的时间点插入到优先队列中

我之前接触的业务中也有类似的业务问题,当时是使用每天0点跑一次定时任务生成隔天的全部数据这种方式处理。但是上线后发现每天0点生成的任务是会有漏的情况,因此补充了一个每隔一分钟生成一次明天当前时间应该执行的任务,现在看来这种处理方案确实比不上 Quartz 的处理方式

#定时任务#原理
最后更新: 2/23/2026, 9:23:04 AM
Linux 文件系统
详解 kafka

← Linux 文件系统 详解 kafka→

最近更新
01
vibe coding 最佳实践
02-24
02
立直麻将牌效益理论
02-23
03
伪静态是什么
02-08
更多文章>
Theme by Vdoing
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式