在阿里云容器服务中运行离线作业
目前在在线应用,尤其是无状态的在线应用领域,Docker容器已经成为执行层的事实标准,有大量云服务商提供容器云服务。但在离线计算领域,还很少有服务商提供这样的能力。
但离线计算在实际生产中使用很广,小到一个脚本任务,大到大数据分析;而且离线计算对资源隔离、环境隔离的需求更高,这正是docker容器的优势。因此,阿里云容器服务抽象出离线计算的基本模型,推出了基于Docker容器的离线计算功能。其核心功能是:
- 作业编排
- 作业调度与生命周期管理
- 存储与日志等功能的集成
基本概念
首先介绍一下离线计算的基本概念。下表中列出了离线与在线应用的概念对比。
| 概念 | 离线应用 | 在线应用 |
|---|---|---|
| 容器 | 任务执行单元 | 服务的执行单元 |
| 运行历史 | 任务出错重试的执行历史 | 无 |
| 服务(任务) | 一个特定的功能,可以分割成若干个容器来执行 | 一组功能相同的容器 |
| 应用(作业) | 若干个任务的组合 | 若干个服务的组合 |
简言之