首次公开!菜鸟弹性调度系统的架构设计
为什么菜鸟需要弹性调度?
在弹性调度出现之前,菜鸟整体资源使用率都处于一个比较低的水平,这是因为:
1.在线应用一般是通过单机性能压测,并且结合经验预估业务流量的方式来确定所需容器数量。这种方式很大程度上会受到评估者主观因素的干扰,在估算业务流量时也通常会保留较大的冗余。
2.以往的模式下,一个应用分组的扩缩容操作频率很低,这使估算业务流量时,需要以每天的峰值流量以及未来一段时间(通常以月为单位)内业务的发展情况来作为评估标准。而一般峰值流量出现时段可能只占全天时间的一小部分,非峰值时段就出现大量的资源浪费。
从接入的弹性应用分组表现来看,容量评估不准确是非常普遍的现象,而且与实际偏差值非常大。弹性调度作为一种在线动态评估系统运行状态并且做出扩缩容决策的系统,它让应用的开发者以及运维人员对资源的关注点,从具象化的容器数转换成抽象程度更高的