什么是xxl-job?
xxl-job是一个分布式的任务调度平台,其核心设计目标是:学习简单、开发迅速、轻量级、易扩展,现在已经开放源代码并接入多家公司的线上产品线,开箱即用。xxl是xxl-job的开发者大众点评的许雪里名称的拼音开头。
xxl-job框架主要用于处理分布式的定时任务,其主要由调度中心和执行器组成。
调度模块(调度中心):
负责管理调度信息,按照调度配置发出调度请求,自身不承担业务代码。调度系统与任务解耦,提高了系统可用性和稳定性,同时调度系统性能不再受限于任务模块;
支持可视化、简单且动态的管理调度信息,包括任务新建,更新,删除,GLUE开发和任务报警等,所有上述操作都会实时生效,同时支持监控调度结果以及执行日志,支持执行器Failover。
执行模块(执行器):
负责接收调度请求并执行任务逻辑。任务模块专注于任务的执行等操作,开发和维护更加简单和高效;
接收“调度中心”的执行请求、终止请求和日志请求等。
总结:
调度中心:统一管理任务调度平台上的调度任务,负责触发调度执行,并且提供任务管理平台。
执行器:接收调度中心的调度并且执行,可以直接执行也可以集成到项目中。
调度中心和执行器两个模块分开部署,相互分离,两者之间通过RPC进行通信,其中调度中心主要是提供一个平台,管理调度信息,发送调度请求,自己不承担业务代码,而执行器接受调度中心的调度执行业务逻辑。
xxl-job的原理
执行器的注册和发现
执行器的注册和发现主要是关系两张表:
xxl_job_registry:执行器的实例表,保存实例信息和心跳信息,xxl_job_group:每个服务注册的实例列表。
执行器启动线程每隔30秒向注册表xxl_job_registry请求一次,更新执行器的心跳信息,调度中心启动线程每隔30秒检测一次xxl_job_registry,将超过90秒还没有收到心跳的实例信息从xxl_job_registry删除,并更新xxl_job_group服务的实例列表信息。
调度中心调用执行器
调度中心的操作:
调度中心通过循环不停的:关闭自动提交事务,利用mysql的悲观锁,其他事务无法进入
select * from xxl_job_lock where lock_name = ‘schedule_lock’ for update
1.读取数据库中的xxl_job_info:记录定时任务的相关信息,该表中有trigger_next_time字段表示下一次任务的触发时间。拿到距离当前时间5s内的任务列表,分为三种情况处理:
对于当前时间-任务的下一次触发时间>5,直接调过不执行,重置trigger_next_time的时间。(超过5s)
对于任务的下一次触发时间<当前时间<任务的下一次触发时间+5的任务(不超过5s的):
(1)线程处理执行触发逻辑,根据当前时间更新下一次任务触发时间
(2)如果新的任务下一次触发时间-当前时间<5,放到时间轮中,时间轮是一个map:
private volatile static Map<Integer, List> ringData = new ConcurrentHashMap<>();
(3)根据新的任务下一次触发时间更新下下一次任务触发时间
对于任务的下一次触发时间>当前时间,将其放入时间轮中,根据任务下一次触发时间更新下下一次任务触发时间
commit提交事务,同时释放排他锁
执行器的操作:
执行器接收到调度中心的调度信息,将调度信息放到对应的任务的等待队列中
执行器的任务处理线程从任务队列中取出调度信息,执行业务逻辑,将结果放入一个公共的等待队列中(每个任务都有一个单独的处理线程和等待队列,任务信息放入该队列中)
执行器有一个专门的回调线程定时批量从结果队列中取出任务结果,并且回调告知调度中心