字节跳动开源 Gödel Scheduler:在离线统一调度器
字节跳动宣布基于 Kubernetes 系统自研分布式调度器:Gödel Scheduler。一个能统一调度在线和离线业务的分布式调度器,能在满足在离线业务功能和性能需求的前提下,提供良好的扩展性和调度质量。
具备如下主要特点:
-
基于 K8s Scheduler,结合乐观并发思想,把最耗时的应用到节点匹配(filtering and scoring)操作放在 scheduler 组件,可以并发执行,提高大规模集群调度吞吐;
-
两层调度语义抽象(Unit 和 Pod)和二级调度框架实现:提供更灵活的“批”调度能力,更好支持离线业务的同时,可以进一步提高调度吞吐和提升系统扩展性 (扩展后的框架可以更好地处理一些特殊场景);
-
丰富的功能和优秀的性能,满足在线,离线(批,流)和训练等业务需求,真正做到统一调度;
-
兼容 Kubernetes 生态,可以替换 K8s Scheduler;
- 由于性能以及架构优化,在 framework interface 上与 K8s Scheduler 不完全一样,但扩展性不受影响,也可以像 Kubernetes 一样实现 scheduling plugin;
架构如下图所示:
Gödel Scheduler 由三个组件组成:Dispatcher、Scheduler 和 Binder。其中,Scheduler 组件是多实例,乐观并发调度, Dispatcher 和 Binder 则是单实例。
公告指出,在过去两年里,Gödel Scheduler 已在字节跳动内部大规模落地,提供丰富的调度语义和功能,包括但不限于 Gang、Job level affinity、微拓扑调度、丰富的排队策略、抢占策略以及调度策略等,它高效稳定地支撑着抖音、今日头条等内部多种复杂业务的运行。
除了架构优化以外,项目团队还基于以前优化 Kubernetes 原生调度器的经验,对 Gödel Scheduler 的实现进行了更深度的性能优化。结合内部优化过的 Kubernetes 系统,Gödel 调度器单分片吞吐可达 2000+ Pods/s, 多分片可达 5000+ Pods/s。并基于此不断提升单集群规模,目前字节跳动内部最大的线上单集群规模已经达到20000+ 节点、100w+ Pods。
经过内部多年反复验证,目前 Gödel 系统已达相对稳定状态。
未来,开源团队计划持续迭代 Gödel scheduler,提供更加丰富的功能和更好的扩展性,不断优化一些特殊场景下(比如高部署率,高抢占频率等)的调度吞吐。同时,通过重调度的方式希望解决调度性能和调度质量难兼顾的难题,在保证调度吞吐的基础上,大幅提升调度质量。以及注重生态建设,兼容适配业务主流的系统和框架。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
OSI 报告:从历史角度看 DOSP 做法
Open Source Initiative (OSI) 于日前发布了一份名为“Delayed Open Source Publication: A Survey of Historical and Current Practices”的新报告,深入研究了 DOSP 的历史、模式以及发展趋势。 延迟开源发布 (DOSP) 是是首先在专有许可证下分发或公开部署软件,然后以开源许可证有计划地发布该软件源代码的做法;Business Source License (BSL) 就是一种广为人知的 DOSP 许可。 在整个开源软件历史中,软件生产商都一直在实践 DOSP;报告收集了一些示例,并对其进行分类以进行分析。 最早的 DOSP 实例之一是 1998 年左右根据"Aladdin Free Public License"发布的 Aladdin GhostScript,后来过渡到同时采用专有许可和 GPL 的发布模型。KDE 的 Qt 库也是一个鲜明的示例,它将 DOSP 作为防止潜在开发中止的一种保障措施。Qt 的许可历史很复杂,如今其可以在商业和开源 GPL 2.0、GPL 3.0 和 L...
- 下一篇
开放签电子签章项目加入渠成开源社区
开放签上线一个月,目前 gitee、github 两个社区截止发稿前 start 总量 426,每周累计增长 100 左右。在开源中国、github、csdn 等社区得到了广大开发者用户的关注,也得到渠成开源社区的关注,感谢他们。 开放签于 2024 年 1 月份正式加入渠成开源社区,希望能跟渠成开源社区一起发展,借助和学习渠成的开源运营方法,把开放签开源社区运营的越来越好。 渠成开源社区介绍 渠成开源社区由禅道项目管理软件团队发起,社区的经营主体为青岛渠成开源计算机网络技术研究中心,是从事非营利性社会服务活动的社会组织。 渠成开源社区主要面向一线开源软件生产者、贡献者、组织者、赞助商和用户,以解决具体实际问题为宗旨,旨在打造以开源软件为核心纽带的开源生态系统,真正做到让每一个优秀的开源软件都能实现商业化。 渠成开源社区要做的事情 渠成开源社区以解决开源实际问题为宗旨,打造以开源软件为核心的开源生态系统。社区会围绕代码工程侧、经营模式侧和社区活动侧这三类事情展开: 帮助开源软件社区把项目做得更好:支持开源任务悬赏,包含开源文档、开源 Bug、开源极客营、开源测试、产品设计、UI 设计等...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果