刘志勇：微博短视频百万级高并发架构-低调大师

刘志勇：微博短视频百万级高并发架构

2018-09-20 887

本文来自新浪微博视频平台资深架构师刘志勇在LiveVideoStackCon 2018讲师热身分享，并由LiveVideoStack整理而成。分享中刘志勇从设计及服务可用性方面，详细解析了微博短视频高可用、高并发架构设计中的问题与解决方案。

文 / 刘志勇

整理 / LiveVideoStack

直播回放：

https://www.baijiayun.com/web/playback/index?classid=18091254327792&session_id=201809131&token=V-GypC7MX7Rt681rrJ0J_YZjM5wzBWRKromDMAweLMaYPgi2WdpRNiiafcpzt7HXn2QZxUVW5JoKp0fXMnVKLQ

大家好，我是来自新浪微博的刘志勇，今天与大家分享的是微博短视频业务的高并发架构，具体内容分为三个方面：

1、团队介绍

2、微博视频业务场景

3、“微博故事”业务场景架构设计

1、团队介绍

我们是隶属于微博研发部视频平台研发部门的技术团队。平台研发是微博的核心部门之一，包括大家熟知的微博视频在内的微博所有核心业务的基础平台架构、用户关系体系等都依赖微博平台研发部门的技术支持。我们的团队主要负责与视频相关的上层业务也就是视频微博、“微博故事”以及短视频和直播，其中直播包括常规的直播与直播答题等新玩法；同时我们还负责底层视频平台的架构搭建，包括文件平台、转码平台、配置调度中心与媒体库。我们致力于用技术帮助微博从容应对每天百万级的视频增量与其背后多项业务的多种定制化需求。

2、微博视频业务场景

我们的业务场景主要是应对热门事件的流量暴涨，例如明星绯闻、爆炸性新闻等势必会让流量在短时间内急剧增长的事件。如何从架构上保证流量暴涨时整体平台的稳定性？如果只是简单地通过调整服务器规模解决，流量较小时过多的服务器冗余带来成本的浪费，流量暴涨时过少的服务器又令平台服务处于崩溃的边缘；比较特别的是，我们面临的问题与诸如“双十一”这种在某一确定时间段内流量的可预见式高并发有着本质的不同，我们面临的流量暴涨是不可预见的。因此通过哪些技术手段来妥善解决以上问题，将是接下探讨的重点。

以上是基于微博的过去已经公开数据量级，非近期内部数据。微博视频是一个多业务接入的综合平台，你可以在微博上看见现在市面上的各种玩法。这就导致我们即将面临的并不是某个垂直业务领域的命题，而是一个构建在庞大体量下的综合性命题，这就导致现有的通用技术框架无法妥善解决我们所面临的难题。因为一些开源方案无法顺利通过技术压测，所以我们只能在开源方案的基础上进行自研与优化才能得到符合微博应用场景需求的技术解决方案。

微博的短视频业务被称为“微博故事”，上图展示的是“微博故事”的展现形态。这是一个布置在微博首页一级入口上的模块，主要展示的是用户关注的人所上传的15秒内的短视频。我们希望强调其“即时互动”的属性，视频只有24小时的有效展示时间。不同用户的视频按照时间轴在上方排序，多个视频可依次观看、评论、点赞等。

3、“微博故事”业务场景架构设计

3.1 微服务架构

上图展示的是这项业务的微服务架构：在接口层我们混布了Web API与内部的RPC请求；在这里我们并未集成具有实际意义的门面层，而接下来的服务层集成了许多微服务，每个微服务集中在一个垂直功能上并可对外提供接口，这里的门面层主要作用是聚合一些微服务并对外提供综合性接口；除此之外还有一些依赖服务例如用户关注、也需要依赖于其他部门的RPC服务；最后的存储层则是集成了Cache与db的标准方案。

3.2 技术挑战

有人曾问到：微博短视频业务的高并发有多高？假设我关注了500名好友，如果有好友发布一个视频就会在“微博故事”头像列表上显示一个彩圈用以提示我去观看；如果我想知道自己所有关注的500个人所发的视频内容，假设首页每秒刷新十万次，那么需要每秒钟五千万的QPS。除此之外我们还需要确定视频是否过期、视频发送顺序等，实际的资源层读取量将远远高于五千万。

3.3 方案比较

640?wx_fmt=png

在构建解决方案时我们思考：可以借鉴微博之前的Feed解决方案，我们不会进行无意义的重复性工作与思考。即使短视频与Feed都具有首页刷新与关注人发布消息聚合的特点，但以用户列表为形式，强调进度续播与即时互动的短视频和以内容列表为形式，强调无阅读状态与永久保存的微博具有本质的区别。

面对一般的Feed应用场景可以使用以下两种模型：Feed推模型与Feed拉模型。

1）Feed 推模型

Feed推模型是指将用户上传发布的内容推送至每一位粉丝，这种方案具有很大的弊端。由于用户尚未达成一定规模，早期的微博以Feed推模型为主导。而现在一个大V用户的粉丝数量普遍都是千万级别，如果依旧使用Feed推模型则意味着千万量级的内容推送，在难以保证千万份推送一致性的情况下，势必会为服务器带来巨大压力。微博的业务强调的就是强时效性下的内容一致性，我们需要确保热点事件推送的瞬时与一致。除了从技术层面很难确保千万级别内容推送的时效性与一致性，由于用户上线状态的不统一，为离线的用户推送强时效性的内容无疑是对服务器等资源的巨大浪费，为了避免以上麻烦我们必须改变思路。

2）Feed 拉模型

Feed拉模型：拉取关注的人并实时查询状态及内容。综合微博的庞大用户体量、数据写入开销与确保一致性三方面我们决定选择Feed拉模型。

640?wx_fmt=png

如何通过Feed拉模型应对如此规模庞大的QPS？首先我们采用了分布式缓存架构，在缓存层集成了数据分片并将缓存通过哈希算法合理分片，之后再把缓存去切片化并进行存取。

3.4 分布式缓存架构

其次我们使用了独有的多级缓存方案也就是L1、 Master 、slave三层缓存方案。L1是一个热度极高容量极小的缓存，我们称其为“极热缓存”，其特点是便于横向扩展。假设L1只有200MB缓存，我们使用LRU算法通过热度分析把访问最热的数据存储在L1中；之后的Master 与Slave的缓存空间则是4GB、6GB，比L1大很多倍。因为微博的流量比较集中于热点事件中某几位明星或某个新闻，小容量的L1可进行快速扩容；在发生热门事件时利用云的弹性自动扩容从而分担热点事件短时间激增的流量压力；由于自动扩容时L1仅占用每台缓存中很小的空间，扩容的速度就会非常快，通过这种手动或自动的瞬间弹性扩容来确保服务器稳定承受热点事件背后的数据激增量。第二层的Master与 Slave具有比L1大好多倍的缓存空间，主要用于防止数据冷穿。虽然L1主要承担的是热点数据，但却无法确保一些短时间内不热但在某个时间段热度突然高涨所带来的流量短时间爆发时服务器的稳定性。

3.5 HA多机房部署

而Master 与Slave作为L1的逻辑分组可有效防止数据过冷，在这里我们采用的是HA多机房部署。例如图中的的两台IDC，我们称左边为IDC-A，右边为IDC-B。缓存层的Master 与Slave是主从同步的关系，双机房的缓存互相主从同步。这里的“互相主从同步”是指IDC-A的MC与IDC-B的MC之间进行双向同步互为主从。因为在进行双机房部署时需要均衡两个机房的流量负载，在缓存层需要使用LRU算法进行热度分析。如果我们将流量分为两份并传输至两个机房，通过每个机房的IRU算法得到的热度信息有一定失真；如果我们在缓存层做相互同步后每个机房的MC都是一个全量的热度算法，那么两个机房的L1基本可实现同步计算得出的热度信息一定是准确的，只有保证热度信息的准确无误才能从容应对流量激增与整个系统的高可用性。在这里需要强调的是，实际上我们在选型上使用的是MC而未使用Redis。

MC对于纯简单数据Key,value的抗量远大于Redis；MC采用预分配内存的形式放置Key,Value，也就是把内存分成若干组相同数据区域，实际上就是若干个数组。这种特殊结构使其在数据定位数组寻址与读写上的速度非常快；这种结构的缺点是：一旦缓存的数据出现变动就会出现即使内存留有空余但数据依旧无法存储的现象。由于这种问题的存在，MC不适用于存储变动大、Value跨度大、业务多变的数据。而Redis作为单线程方案，一致性更好，但在超大规模简单Key,Value读取上速度比MC是要差很多的。

除了上述方案之外，我们还采用了弹性扩缩容。实际应用中，基于成本的考量我们无法部署大量的服务器，于是我们采用了自研的DCP弹性扩缩容平台。首先，我们的自有机房有一些共享机器资源可在特殊情况下动态弹性扩充以应对增加的流量压力。当然，这部分机器的性能是有限的，当数据量超过一定阈值后我们就会接入阿里云并利用我们与阿里云的混合云DCP方式构建一层弹性软平台用于自动扩容承担流量压力；除了弹性扩容我们同时也采用了定时扩容的逻辑，在每天晚高峰时段进行扩缩容从而确保整体服务的稳定性。之所以这么做，主要是为了在保证用户体验的前提下尽可能节约成本。

需要强调的是，扩容对速度的要求十分严格。只有扩容的速度越快，流量峰值来临时可承受的数据量越大，才能确保整体服务的高可用，因而我们也在努力优化扩容的速度。我们的DCP平台上也有晚高峰固定时段扩缩容与突发流量临时扩缩容，通过如流量监控等的自动化容量评估来判断服务器荷载，并通过自动化任务调度妥善解决突发流量对服务器的影响。

3.6 微服务熔断机制

当然，为了保证服务器整体的健康与稳定，我们也在其中集成了微服务熔断机制，其原理类似于家用电表中的保险丝，可在过载的情况下迅速自动熔断。系统会定期进行自我评估并确定每个服务的最大荷载，假设将熔断值定为3000QPS，那么当QPS超过3000、超时或异常时服务即会迅速熔断并关闭，从而确保其他资源的安全稳定。通过这种框架级、细粒度的自动降级机制，系统失败隔离能力可被有效提高，避免了雪崩式的链式宕机事件的发生。在熔断的同时，自动扩容也会同步运行。熔断之后系统会不断更新服务流量荷载，一旦扩容完成或者服务还能继续承受流量即可重新恢复工作，这种熔断机制同样也是为服务器扩容争取时间。

微信关注我们

原文链接：https://yq.aliyun.com/articles/668532

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Python全栈 Web（Flask框架、安装、应用）

Flask 轻量级WEB框架静态网页：不能与服务器交互的网页都是静态网页动态网页：能够与服务器进行交互的网页 WEB：浏览器网页（前端三剑客）服务器：能够给用户提供服务的机器就是服务器硬件来说就是一台主机还要配备一个能够接受用户请求并给出响应用程序 APACHE TOMCAT IIS（Internet Information Service） Nginx（Python用的较多）作用：存储WEB所需要的信息所有的服务器都能够处理用户请求（ request）并作出回应（ response）能够执行服务器端的程序具备一定的安全性功能框架：是一种为了解决开放性问题而存在的一种结构框架本身也提供了一些基本功能，我们只需要在自己的基础功能上搭建属于自己的操作即可 Python的WEB框架: Flask Django Tornado Webpy Flask框架：什么

2018-09-19

711

【杭州云栖】飞天技术汇CDN与边缘计算专场：让内容离消费者更进一步在5G移动通信、IoT万物智联时代即将到来的大背景下，越来越多的应用和数据来自边缘位置，呈现低延时、高带宽、大连接、本地化的业务特征，那么如何协同阿里云全球基础设施建设，进行更好的内容传输和数据计算？在经历了几年的飞速发展，阿里云内容分发网络CDN又是如何以更高的服务质量、更多元的产品组合，来满足全球数十万客户的需求呢？9月19日的飞天技术汇-CDN与边缘计算专场为观众们进行了解答。本分专场邀请了多位阿里云专家，与重磅客户-虎牙直播，一起进行边缘计算ENS、MEC，SCDN、DCDN的产品解读与应用演进，同时，阿里云技术专家也分享了CDN全球节点建设与调度，和网络传输协议优化等技术实践议题。《边缘计算篇》边缘计算ENS：拓展云的边界专场第一议题由阿里云高级技术专家王

2018-09-20

721

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。