对于中国开源界而言,2021年因明确的政策指引就值得说道陈义。对网易数帆而言,2021年开源之路同样值得回顾:一年之内,网易数帆先后推出四个自主开源项目,也将 Kyuubi 项目送入 Apache 基金会孵化。种种行动,让业界更深刻地感受到了网易数帆开源“架构开放,内核开源”的态度。
践行 Apache Way,推动大数据平民化
从早期的 LAMP 架构,到今天的 Hadoop 生态,Apache 软件基金会(ASF)在开源领域影响深远,其形成的 “The Apache Way” ,已经成为引领全球社区开发者进步的开源哲学。2021年,网易数帆遵循这一哲学的努力,也缔造了数帆与 ASF 愈发深厚的缘分。
其一,在 Apache Spark 社区,网易数帆大数据专家燕青(社区 ID:yaooqinn)成为了项目 Committer( https://mp.weixin.qq.com/s/MXAnPRDvQlY71fU3SsoaPg )。从 Databricks 380 亿美元的估值不难看出 Spark 的分量,这得益于社区自诞生之日就大神云集,但也反过来说明在这个顶级项目成熟期成为新晋 Committer 何其困难。事实上,加上燕青,就职中国互联网公司的 Apache Spark Committer 目前也仅 5 位。对此燕青的秘诀是 8 个字:保持活跃,持续贡献。
进入 Apache 孵化器之后,Apache Kyuubi 社区遵循 “The Apache Way” 运作,围绕“Community Over Code”的理念构建良性的用户和开发者生态逐渐成为工作重心。截至目前, 社区开发者数量增长了 10 倍,新晋了 2 位 Committer( https://mp.weixin.qq.com/s/RH5eo0yv0mC1btIel9LvkA ),并在 RELEASE POLICY 下完成了 3 个正式版本的发布 ,实现包括对最新的 Spark 3.x 版本的支持与增强,在数据湖平台 Delta Lake、Iceberg 和 Hudi 之上进行充分的测试,赋予用户调动整个数据湖生态的数据的能力,使得项目成为一个面向 Serverless SQL on Lakehouse 的服务。
冲击云原生,强化生产落地能力
云原生是当前业界核心技术路线,与公有云服务商偏向自家基础设施的优化不同,网易数帆对云原生的追求近乎偏执:网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源提出了一个统一云原生操作系统的设计——以一套 Kubernetes 平台统一管理任意基础设施,支撑任意负载。这与国产软硬件技术推广的趋势暗合,但反过来也对云原生的可落地性提出了更高要求。
实现轻量化的 Kubernetes。 KubeCube 以轻量化的设计理念,补足统一的 多集群多租户管理,提供 Kubernetes 资源可视化管理和丰富的可观测性 ,满足了企业对容器云平台的期待。一位用户分享了自己在 UK8S 集群上做简单的部署对接测试的笔记,前后 6 步即可完成安装部署,其中包括了一些必要的配置。
破解 Kubernetes 运维之痛。 KubeDiag 作为云原生诊断运维编排框架,创新性地实现了 “经验即代码” ,即诊断经验全部通过代码实现并通过标准化的方式集成到框架中,可运行于任意 Kubernetes 环境。通过 Kubernetes 提供的标准化能力,KubeDiag 将问题诊断和故障运维工作中的专业经验进行沉淀,助力用户实现 DevOps 流程中监控、运维、诊断的全自动化管理以及场景化的交互式根因定位 。
突破 Istio 管理缺陷。 Slime 项目的推出,完善了 Istio 在本地限流、黑白名单、降级等微服务治理的高阶特性的缺陷,以及配置全量下发的负担,提升了易用性和性能。而作为 Istio 的 CRD 管理器,Slime 支持无缝对接 Istio, 无需任何的定制化改造 。
扩展 Istio 的云原生网关。 采用 Envoy 作为网络代理组件,Hango 提供了适用微服务网关、七层负载均衡、Kubernetes Ingress、Serverless网关等 各种云原生场景的 API 网关能力和可观测性 ,当然还有 C++ 加持的 高性能 ,单实例性能可达10w TPS以上,领先业界竞品 50%+。
推进开源管理,探索开源供应链治理
可以看到,包括 2020 年开源的云原生软件定义存储系统 Curve,网易数帆的每一个项目都很有特色,各有使用场景。但项目数量增多,也意味着开源管理的问题。借鉴业界实践,数帆初步形成了一套开源管理规范,在每个项目开源之前,借助网易杭州研究院技术委员会 对其价值、社区、应用、影响力、技术创新与先进性及团队能力等进行严格的评估 。公司高层对开源的支持也更为明确,汪源撰文指明了开源模式对企业级基础软件的重要性和网易数帆的开源思路( https://mp.weixin.qq.com/s/9eujTFc-MOmB8xbY07-V2A )。
作为一家坚持开源开放的企业服务提供商,开源供应链治理也是网易数帆的必答题,这涉及管理机构、管理制度、开源引入溯源、交付物管理等多个方面。凭借一套涵盖管理机构、管理制度、过程卡点和结果导向的开源供应链治理策略和相应的工具集,网易数帆轻舟微服务平台通过了信通院首批可信开源供应链风险管理能力评估——也是首个通过该项评估的微服务/服务网格类产品。
持续布道,融入社区分享开源经验
为构建良好的社区生态,降低开发者和用户理解项目的门槛,开源团队也联合社区用户积极开展或参与社区布道,并生产了 一系列高质量的技术解读文章,包括架构设计的思考、技术实现的要点、业务应用的成效等。2021 年,网易数帆贡献了 12 场线上/线下开源分享,生产了 20 篇优质文章,据不完全统计覆盖受众 50000+。
写在最后
2021 年是网易数帆自主开源开始发力的一年,当然我们还有更多开源故事,例如在其他社区项目的贡献和分享,受邀加入开放原子基金会下的 openEuler 社区加强国内开源生态的建设,在此不再赘述。
深耕企业级基础软件,坚持“架构开放,内核开源”的战略,网易数帆得到了社区的良性反馈。未来,网易数帆还会开源更多的能力。例如,云原生日志项目 Loggie、实时数据湖引擎 Arctic 都已经在筹备开源之中,不久之后大家会看到我们的新消息。
对于数字化转型浪潮下企业级基础软件的革新,网易数帆目前的开源成果只是前进了一小步,我们的项目还很年轻,我们在开源领域还只是一个懵懂的中学生,因为热爱而肆意挥洒才华。不过,也正因为如此,网易数帆开源的“大学”将会有更大的想象空间。在此,我们呼唤志同道合的伙伴加入我们的社区建设,共同创造开源数字化基础软件的美好未来!
附:网易数帆自主开源技术文章
了解更多信息,请移步网易数帆开源主页: