作者:小天才内部 IT 运维负责人 汤英杰
小天才,作为步步高教育电子旗下专注于儿童智能设备的科技品牌,自 2015 年推出首款产品以来,已成为 中国儿童智能手表市场的领军企业。核心产品涵盖儿童电话手表、学习平板等,主打“安全、教育、陪伴”三大核心功能。凭借精准定位、家长管控、健康监测等差异化技术,构建了完整的儿童智能生态系统。2024 年,小天才荣获中国移动“ 最受欢迎智能终端品牌”奖。2025 年一季度,线上市场销量占比达到 27.6%,稳居行业榜首。
随着内部 IT 生产制造、办公及外部营销数字化 业务不断增加,传统 IT 交付体系面临 海量设备数据管理、 全球化混合云架构支持及 日益严苛的安全合规挑战。为保障在各办公、营销场景中的产品体验,确保业务运营稳定,小天才内部 IT 决定转型,构建高效、稳定的云原生智能交付体系,以支撑业务的持续创新与拓展。
一、云原生转型背景与技术栈演进
时间线:早期业务部署在 Windows/Linux 服务器,采用手工 / 脚本构建部署;2020 年全面拥抱云原生。
技术栈转向:内部 IT 开发技术栈全面转向 Java、JavaScript/TypeScript。
K8s 集群方案:RKE2、K3S、ACK、ACS
二、软件交付流水线演进历程(2020-2025)
1. Rancher Pipeline(2020-2022 年)
核心特点:基于 Rancher 平台的 CI/CD 工具,集成 K8s 管理。
优点:
缺点:
转型动因:官方弃用旧版本 Pipeline,且 RKE 迁移至 RKE2 后兼容性问题突出,无法满足规模化生产需求。
2. Jenkins(2022-2023 年)
核心特点:开源 CI 工具,支持灵活定制流水线。
优点:
缺点:
转型动因:缺少全流程自动化能力,安全生产与效率难以平衡。
3. 其他工具尝试
ArgoCD/Argo: 适合声明式部署,但依赖运维团队,对开发团队不友好。
KubeVela: 专注应用交付,功能单一,无法覆盖全链路流水线需求。
结论:均无法满足“构建–测试–发布–环境管控”一体化需求。
4. Zadig 基础版(2022-2024 年)
核心特点:云原生 CI/CD 平台,支持多集群与模板化管理。
优点:
不足:
-
基础版仅支持测试环境管理,缺乏生产环境管控;
-
工作流模板扩展性有限,难以满足复杂业务需求;
-
接入流程对开发团队规模扩大后仍显复杂。
瓶颈:生产环境管控缺失、模板能力不足,卡在 v1 版本三年。
5. Zadig 企业版(2025 年至今)
升级动因:业务扩张与生产稳定性需求驱动,需解决人为故障、环境管控等核心痛点。
核心功能价值:
|
需求场景
|
企业版解决方案
|
收益
|
|
生产环境严格管控
|
环境隔离、发布审批流程、版本锁定
|
降低误操作风险,提升发布可靠性
|
|
模板化与标准化
|
构建模板、工作流模板、代码扫描模板
|
统一交付流程,减少重复配置耗时
|
|
多集群与资源管理
|
跨集群流量调度、资源配额管理
|
优化资源利用率,支持混合云 / 多集群架构
|
|
简化开发团队接入
|
业务目录可视化、自助式服务门户
|
降低新成员学习成本,提升协作效率
|
|
质量环节缺失
|
集成测试、自动化验证插件(待扩展)
|
完善交付质量体系,减少缺陷流入生产
|
长期价值:构建 “标准化交付 + 智能化管控 + 全链路质量” 的云原生交付体系,释放研发产能。
三、关键转型总结与启示
-
工具选型逻辑:
-
核心痛点解决路径:
-
环境管控:从无差别发布转向测试、预发、生产严格隔离,通过企业版审批流程实现管控。
-
效率瓶颈:模板化显著减少重复配置,业务目录降低协作成本。
-
团队适配:推动“运维驱动”向“开发自助化”转变,降低对 K8s 底层依赖。
-
未来规划方向:
四、技术决策建议
中小团队初期:优先尝试 Zadig 基础版,快速搭建模板化流水线,提升测试环境交付效率。
规模化团队:升级企业版前,重点评估生产环境管控细则(审批节点、权限分级),确保流程与工具深度契合。
生态整合:充分利用 Zadig 与 Prometheus(监控)、SonarQube(代码扫描)等工具集成,打造完整 DevOps 闭环。
五、总结
通过工具链的迭代和流程自动化,小天才内部 IT 团队逐步从 “手工交付” 迈向 “标准化、智能化” 的云原生交付体系,为业务高速发展提供了稳定的工程效率底座。