一切都是为了更高效(写在国内第一次DataOps + MLOps meetup之后)
上周六即3月12日,星策开源社区组织了国内第一次DataOps + MLOps的meetup,感谢CSDN和51CTO同步直播,活动圆满结束。
现在简单回顾一下。
1. 为什么组织这么一场Meetup?
是因为我感觉到,DataOps和MLOps虽然在国外已经开始流行了,但是在国内还是比较陌生的,有必要组织这样的活动,让更多的工程师了解DataOps和MLOps是什么,能够干什么,对业务的价值,以及其中的技术难点和相应比较成熟的技术方案都有什么。
2. 各种Ops的异同
最近几年DevOps之后出现了各种Ops,包括DevSecOps,GitOps,AIOps,NoOps,DataOps,MLOps,FeatureOps,ModelOps等等。他们的相同点都是各种Ops任务(Operation)的自动化,都包含相应的流程、工具和角色;不同点是面向不同的领域,涉及不同的角色,以及自动化的任务不同而已。核心还是为了更高效,手段还是自动化。
DataOps是在数据分析领域,目标是为了提高数据分析的质量并缩短周期,涉及角色包括数据科学家、数据工程师,IT工程师等,任务包括数据搜集,数据ETL,数据可视化等
这个图很好的表示了DataOps的全部过程。
接着来说MLOps,它面向的领域是机器学习,目标是提高机器学习落地的效率,涉及角色包括AI科学家、AI数据工程师、IT工程师,任务包括场景定义,数据搜集和整理,模型训练和部署,持续监控和更新等。同样用一个图来表示如下。
用一张表来总结DevOps和DataOps以及MLOps的区别。
(CI:continuous Integration,持续集成;CD:Continuous Deploy,持续部署;CT:Continuous Training,持续训练;CM:Continuous Monitoring,持续监控)
各种Ops | 对象 | 过程 |
DevOps | Code | CI + CD |
DataOps | Code + Data | CI + CD |
MLOps | Code + Data + Model | CI + CD + CT +CM |
3. Meetup 议程
(1)我首先分享了我对DataOps和MLOps的理解,见上文。
(2)Apache DophinScheduler的PMC leader 郭炜,江湖人称郭大侠分享了他对DataOps的洞察,并重点介绍了被他称之为“DataOps领域内的K8S”----Apache DophinScheduler项目,它作为一个支持可视化操作,分布式的数据操作编排系统,从定位上来看确实很像云原生领域内的K8S。
(3)OpenMLDB的架构师 陈迪豪同学分享了他对MLOps的认识,并重点介绍了他重点参与的开源项目,OpenMLDB。OpenMLDB能极大的提升机器学习上线的效率,并降低机器学习从业人员的门槛。因为它可以支持用SQL进行特征提取,然后把对应提取的SQL语句直接上线,这样保证了训练和预测所使用到的数据和代码的一致性,高效的解决数据一致性的问题。此外OpenMLDB还有很多优点和特性,欢迎看他的PPT和视频。
4. 总结。
DataOps和MLOps作为各种Ops中的后起之秀,可以在各自领域即数据分析和机器学习领域,起到很大的作用。虽然国内现在还不是很流行,相信随着国内大数据和机器学习在更多企业的落地,尤其是企业数字化转型的推进会极大促进这两者的进一步发展。
5. 附上这次meetup的视频
- DevOps后的各种Ops相同点和区别在哪?——谭中意
链接:https://www.bilibili.com/video/BV16P4y1M7xC?spm_id_from=333.999.0.0
- DataOps &DolphinScheduler——郭炜
链接:https://www.bilibili.com/video/BV1FT4y1U7Kp?spm_id_from=333.999.0.0
- 使用OpenMLDB打造MLOps场景应用——陈迪豪
链接:https://www.bilibili.com/video/BV1FS4y1D7gB?spm_id_from=333.999.0.0
6. 最后,我们组建了MLOps的爱好者讨论群,目前有超过100多人已经加入,每天讨论各种相关技术问题,欢迎爱好者加入。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
数据库设计建议
1.概述 本开发设计建议约定数据库建模和数据库应用程序开发过程中,应当遵守的设计规范。依据这些规范进行建模,能够更好的契合openGauss的分布式处理架构,输出更高效的业务SQL代码。 本开发设计建议中所陈述的“建议”和“关注”含义如下: 建议:用户应当遵守的设计规则。遵守这些规则,能够保证业务的高效运行;违反这些规则,将导致业务性能的大幅下降或某些业务逻辑错误。 关注:在业务开发过程中客户需要注意的细则。用于标识容易导致客户理解错误的知识点(实际上遵守SQL标准的SQL行为),或者程序中潜在的客户不易感知的默认行为。 2.数据库对象命名 数据库对象命名需要满足约束:非时序表长度不超过63个字节,时序表长度不超过53个字符,以字母或下划线开头,中间字符可以是字母、数字、下划线、$、#。 【建议】避免使用保留或者非保留关键字命名数据库对象。 说明:可以使用select * from pg_get_keywords()查询openGauss的关键字,或者在关键字章节中查看。 【建议】避免使用双引号括起来的字符串来定义数据库对象名称,除非需要限制数据库对象名称的大小写。数据库对象名称大小写...
- 下一篇
OpenHarmony移植:XTS子系统之应用兼容性测试套件
摘要:本文通过实例分析下ACTS应用兼容性测试套件移植案例,以及移植过程中特定的操作的原理。 本文分享自华为云社区《移植案例与原理 - XTS子系统之应用兼容性测试套件》,作者:zhushy。 XTS(X Test Suite)子系统是OpenHarmony生态认证测试套件的集合,当前包括: acts(application compatibility test suite)应用兼容性测试套件,看护北向HAP兼容、OpenHarmony开发API兼容。 hats(Hardware Abstraction Test Suite )硬件抽象测试套,看护HDI层接口。 dcts(Distributed Compatibility Test Suite )分布式兼容性测试套,看护分布式兼容(待上线) 本文主要通过实例分析下ACTS应用兼容性测试套件移植案例,以及移植过程中特定的操作的原理。主要讲述的是轻量系统兼容性测试。轻量系统因系统能力限制,兼容性测试在系统初始化阶段进行;并且各设备烧录工具存在差异,导致自动化工具(xDevice工具)无法实现真正的自动适配,因此认证执行方式不对合作伙伴进行...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库