开源官宣:Prophecis 一站式云原生机器学习平台
Prophecis 一站式云原生机器学习平台
Prophecis 是微众银行自研大数据平台套件 WeDataSphere 的核心应用工具之一,为用户提供了全栈的机器学习应用开发与部署解决方案。作为WeDataSphere 功能工具应用系统,Prophecis 不仅和已经开源的产品DataSphere Studio、Linkis无缝对接,同时也可以独立运行。
Prophecis Github地址:
https://github.com/WeBankFinTech/Prophecis
*详情可点击文末阅读原文
01
Prophecis是什么
Prophecis 是微众银行大数据平台团队开发的一站式机器学习平台,其采用云原生技术方案,提供生产环境全栈化容器部署与管理服务,致力于打通机器学习建模的整个生命周期的Pipeline。Prophecis提供多种模型训练调试方式,集成多种开源机器学习框架,具备机器学习计算集群的多租户管理能力。
02
为什么需要Prophecis
数据接入,数据是一切得以实现的前提。最简单的方式是通过上传来解决。企业内部往往会基于大数据平台,通过数据导入等方式接入。或者通过数据映射的方式,数据不需要导入,直接就可以通过外部访问;
开发环境,数据科学家基本对此达成了共识,都会选择类似 Jupyter 这样的工具;
分布式训练,类似Tensorflow、PyTorch 等都提供一些方法可以做分布式训练;
模型管理,这是现在比较个性化的模块,不同的公司会有不同的实现。明略科技的模型管理是涵盖模型生成、模型部署以及更新迭代的全流程实现。
03
Prophecis整体架构
-
Prophecis Machine Learning Flow:机器学习分布式建模工具,具备单机和分布式模式模型训练能力,支持Tensorflow、Pytorch、XGBoost等多种机器学习框架,支持从机器学习建模到部署的完整Pipeline; -
Prophecis MLLabis:机器学习开发探索工具,提供开发探索服务,是一款基于Jupyter Lab的在线IDE,同时支持GPU及Hadoop集群的机器学习建模任务,支持Python、R、Julia多种语言,集成Debug、TensorBoard多种插件; -
Prophecis Model Factory:机器学习模型工厂,提供机器学习模型存储、模型部署测试、模型管理等服务; -
Prophecis Data Factory:机器学习数据工厂,提供特征工程工具、数据标注工具和物料管理等服务; -
Prophecis Application Factory:机器学习应用工厂,由微众银行大数据平台团队和AI部门联合共建,基于青云(QingCloud)开源的KubeSphere定制开发,提供CI/CD和DevOps工具,GPU集群的监控及告警能力。
04
Prophecis核心特征
-
全生命周期的机器学习体验:Prophecis的Machine Learning Flow 通过 AppJoint 可以接入到 DataSphere Stdudio 的工作流中,支持从数据上传、数据预处理、特征工程、模型训练、模型评估到模型发布的机器学习全流程; -
一键式的模型部署服务:Prophecis MF 支持将Prophecis Machine Learning Flow、Prophecis MLLabis 生成的训练模型一键式发布为 Restful API 或者 RPC 接口,实现模型到业务的无缝衔接; -
机器学习应用部署、运维、实验的综合管理平台:基于社区开源方案定制,提供完整的、可靠的、高度灵活的企业级机器学习应用发布、监控、服务治理、日志收集和查询等管理工具,全方位实现对机器学习应用的管控,满足企业对于机器学习应用在线上生产环境的所有工作要求。
05
Prophecis和WeDataSphere
Linkis TFOS Engine: Prophecis 通过构建 Linkis TFOS Engine,支持从任务提交到 YARN,为平台提供了SparkML、TensorflowOnSpark、XGBoost On PySpark、LightGBM On PySpark等分布式建模能力;
Machine Learning Flow Pipeline:Prophecis通过对接Linkis的Flow Engine、DataSphere Studio的Appjoint插件集成能力,实现了机器学习实验工作流调度功能;
-
集成DSS工作流 :在复用DSS和Linkis能力的同时,Prophecis也构建了对应的DSS Prophecis AppJoint,为DSS的工作流模块提供了云原生机器学习建模能力; -
LinkisMagic :Prophecis构建Linkis相应Magic函数,目前主要对接了Spark相关引擎类型,完善了Jupyter Notebook的大数据开发功能,为用户提供了一站式、交互式的AI开发环境。
06
Prophecis和KubeSphere
KubeSphere 是在 Kubernetes 之上构建的以应用为中心的多租户容器管理平台,作为面向云原生应用的容器混合云,其愿景是打造一个以 Kubernetes 为内核的云原生分布式操作系统,它的架构可以非常方便地使第三方应用与云原生生态组件进行即插即用(plug-and-play)的集成,支持云原生应用在多云与多集群的统一分发和可视化运维管理。
更多关于KubeSphere的介绍,请访问:
KubeSphere 官网中国站 (https://kubesphere.com.cn)
KubeSphere GitHub(https://github.com/kubesphere)
Prophecis在Application Factory的建设中引入了 KubeSphere,对其进行了定制开发,实现了机器学习容器应用从镜像发布、实例部署、多租户资源隔离、服务监控到日志收集的自动化管理,极大的降低了机器学习应用的运维成本。同时,WeDataSphere和KubeSphere 两大社区也达成了开源合作的意向,朝着共建云原生大数据生态前进,为中国的新基建事业添砖加瓦。
07
Prophecis近期版本规划
当前Webank的Prophecis已经完成与DataSphereStudio对接,打通了整个MLFlow的数据链路Pipeline,后续我们会按照Roadmap逐步放出剩下功能,Prophecis RoadMap规划:
Prophecis v0.1.x
服务部署脚本
用户管理台
Namespace、存储、资源管理
多租户隔离的个人开发环境(Jupyter Lab)
大数据开发方案(Livy&原生方案)
LinkisMagic
MLLabis
Control Center & UI
Prophecis v0.2.x
基础平台自动化部署脚本(Kubernetes/Docker/GPU)
分布式建模
批量任务计算、告警
CLI
MLFlow
Base
Prophecis v0.3.x
资源管理、监控
模型部署
Model Factory(模型工厂)
Application Factory(应用工厂)
08
总结
WeDataSphere,BIG DATA MADE EASY.
用心做一个有温度的开源社区
~欢迎关注~
扫码关注我们
微信号公众号 : WeDataSphere
GitHub:WeDataSphere
如果喜欢我们的产品或文章,请给我们的GitHub点上你宝贵的star和fork哦~~
本文分享自微信公众号 - WeDataSphere(gh_273e85fce73b)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
抖音爬虫教程,AndServer+Service 打造 Android 服务器实现 so 文件调用
随着 Android 移动安全的高速发展,不管是为了执行效率还是程序的安全性等,关键代码下沉 native 层已成为基本操作。 native 层的开发就是通指的 JNI/NDK 开发,通过 JNI 可以实现 java 层和 native 层(主要是 C/C++ )的相互调用,native 层经编译后产生 so 动态链接库,so 文件具有可移植性广,执行效率高,保密性强等优点。 那么问题来了,如何调用 so 文件显得异常重要,当然你也可以直接分析 so 文件的伪代码,利用强悍的编程功底直接模拟关键操作,但是我想对于普通人来说头发还是比较重要的。 当前调用 so 文件的主流操作应该是: 1,基于 Unicorn 的各种实现(还在学习中,暂且不表) 2,Android 服务器的搭建,在 App 内起 http 服务完成调用 so 的需求(当然前提是过了 so 的效验等操作) 至于为什么选用 AndServer,好吧,不为什么,只是因为搜索到了它 为什么结合 Service,在学习 Android 开发的时候了解到了 Service 的生命周期,个人理解用 Service 去创建 Http...
- 下一篇
TiDB 在金融行业关键业务场景的实践(上篇)
TiDB 作为一款高效稳定的开源分布式数据库,在国内外的银行、证券、保险、在线支付和金融科技行业得到了普遍应用,并在约 20 多种不同的金融业务场景中支撑着用户的关键计算。本篇文章将为大家介绍分布式关系型数据库 TiDB 在金融行业关键应用领域的实践。 金融关键业务场景 银行的业务系统非常复杂,包括从核心上的账户、账务、结算等业务到外围的各种存、贷、票、汇以及面向互联网场景的各类金融业务。 随着科技的发展,整个银行的核心交易系统走在自己的一个演进道路上,从传统的集中式应用结构逐步向服务化、分布式这样的体系在演进。在国内,已经有若干家在科技方面比较领先的银行机构启动了对于核心的改造工作,在他们整个核心交易应用以及背后的数据处理层引入了非常多分布式的技术来支撑他们业务的发展。在未来,整个发展方向会更多的向单元化、服务化发展,并且一些应用支撑的框架,例如云、微服务、未来的 serverless 等,都会逐渐的向核心交易引入。 分布式核心系统架构对整个数据库有以下几点比较明确的要求: 安全,稳定,可靠; 提供分布式计算与分布式数据管理及在线弹性扩展能力; 提供高并发,低延迟,大吞吐的数据库处理...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作