背景
接上篇文章,继续来辨析一下这些技术概念:
- Spring Task,任务调度
- Quartz,任务调度框架
- Spring Cloud Task,短周期任务管理框架
- Spring Batch ,批处理应用构建框架
- Spring Cloud Data Flow,构建数据集成和实时数据处理流水线的工具包
任务调度框架
Spring Task 和 Quartz 是两个任务调度框架,都支持 Cron 表达式方式执行周期性的任务,对比如下:
框架名称 | 厂商 | 使用方式 | 集群支持能力 |
Spring Task | Spring 框架 | @Scheduled | 无 |
Quartz | OpenSymphony开源组织 | API | 有 |
对于包含周期性任务调度的需求,可以选择用这两个框架。
Spring Cloud Task
Spring Cloud Task可以在平台环境中执行短生命周期的应用,并记录这些应用的结果,经由通过消息通知的机制来集成各个tasks。该特性可以让短生命周期的应用像长生命周期的应用一样,组成微服务架构。
本质就是通过 @EnableTask 标签,让某个 SpringBoot 应用的运行过程被记录下来。
Spring Batch
批处理应用构建框架,它不是一个任务调度框架,而是一个定义批处理流程的框架。任务的触发方式有两种,一种是手动触发,另一种定时任务触发。
Spring Batch 与 Spring Cloud Task 一起使用时,可以将批处理任务作为一个短运行期的应用被监控起来。
Spring Batch + Spring Cloud Task ,监控批处理任务。
Spring Batch + 任务调度框架,定期触发批处理任务,这是比较常见的使用组合,因为批处理任务的本质就是基于时间消息驱动应用。
Spring Cloud Data Flow
Spring Cloud Task 是 Spring Cloud Data Flow 的一个基础模块。构建数据流应用时,
Spring Cloud Data Flow 的数据处理有两种模式,分别是 Streaming 流式处理和 Batch 批次处理。
Streaming 处理模块是基于消息驱动的、长时间一直存在,数据来了就处理,没来就等着。
Batch 是处理时间较短的应用,启动一次处理一次,处理完就退出任务,需要手动或自动触发任务,这类应用可以用 Spring Batch 或 Spring Cloud Task 构建。
启示录
这几个技术可能会组合使用,仔细辨析一下,还是比较容易区分的。
再次总结一下各自的用法:
- 定时任务调度框架:Spring Task ,Quartz。
- 可监控的短运行期的应用构建框架:Spring Cloud Task。
- 批处理流程定义框架:Spring Batch,集成任务调度框架可以实现定时批处理任务运行;集成 Spring Cloud Task ,实现可监控的批处理应用。
- 实时数据流应用构建框架: Spring Cloud Data Flow,它可以集成 Spring Cloud Task 和 Spring Batch 的应用。