Substra 加入 LF AI & Data 作为新的孵化项目,更多隐私保护联邦学习用例即将到来
LF AI & Data 基金会是一个正在构建生态系统以维持人工智能(AI)和数据开源项目的开源创新的组织,今天宣布Substra[1]为其最新的孵化项目。
Substra 是一个在合作伙伴之间提供机器学习任务分布式编排的框架,同时保证所有操作的安全可靠的可追溯性。Substra 项目是由OWKIN[2]在 Apache-2.0 许可下发布和开源的。
Substra 实现了保护隐私的联邦学习项目,在该项目中,多方针对机器学习目标进行协作,而每个人都将自己的私人数据集保存在自己的防火墙之后。它的雄心是使新的科学和经济数据科学合作成为可能。
使用 Substra 框架的数据科学家能够:
-
使用任何 Python ML 框架使用他们自己的 ML 算法
-
将他们的算法放到远程数据上进行训练和/或预测,并监控他们的性能
-
构建跨多个远程数据集学习的高级联邦学习策略
使用 Substra 框架的数据管理员能够:
-
将其数据集提供给其他合作伙伴进行培训/评估,确保不能查看或下载
-
为你的数据集选择微调过的权限来控制其生命周期
-
监控数据是如何使用
-
参与先进的多伙伴数据科学合作,即使合作伙伴拥有竞争的数据集。
LF AI & Data 执行董事 Ibrahim Haddad 博士说:“我们很高兴欢迎 Substra 项目加入 LF AI & Data。该项目使数据科学家能够将他们自己的 ML 算法与任何 Python 框架一起使用,将他们的算法部署到远程数据上进行训练和/或预测,并监控其性能,并构建跨多个远程数据集学习的高级联邦学习策略。我们期待与社区合作,以扩大项目的足迹,并与我们的成员和其他托管项目为其创造新的合作机会。”
Substra 运营分布式机器学习,旨在为可追踪的数据科学提供工具。
-
数据局部性:数据保留在所有者的数据存储中,从不传输。人工智能模型从一个数据集到另一个数据集。
-
去中心化的信任:所有的操作都是由分布式账本技术协调的。不需要单一的受信任的参与者或第三方;安全源于网络。
-
可追溯性:不可变的审计跟踪记录了平台上实现的所有操作,简化了模型的认证。
-
模块化:Substra 是高度灵活;可以针对每个特定的用例强制执行各种权限机制和工作流结构。
Substra 项目的创始人 Camille Marini 说:“我代表所有为 Substra 框架做出贡献的人,对它被 LF AI & Data 基金会接受为孵化项目感到激动和自豪。Substra 被设计为支持基于敏感数据的分布式数据源创建 ML 模型的协作/协作。事实上,我们认为,如果不确保数据隐私和治理不受影响,使用 ML 进行发现是不可能的。我们还相信,数据所有者和数据科学家之间的协作是能够创建良好的 ML 模型的关键。这些价值与 LF AI & Data 共享,因此它是 Substra 项目的完美家园。我们希望它能为人工智能和数据领域带来价值。”
Substra 基金会总经理 Eric Boniface 说:“我们在 Substra 基金会非常高兴和自豪看到 Substra 项目成为一个由 LF AI & Data 托管的项目。作为该项目开源社区的第一把伞,托管资源库,编写文档,创建社区工作组,并为HealthChain[3]和MELLODDY[4]项目等第一个真实世界旗舰用例做出贡献,这是与开发该框架的 Owkin 团队分享的一段令人难以置信的经历。这只是中等规模的第一步,我们相信加入像 LF AI & Data 这样经验丰富的全球基金会作为孵化项目是一个很好的机会,也是 Substra 项目、其社区和社区的完美下一章。更多隐私保护联邦学习用例即将到来!”。
LF AI & Data 通过广泛的服务支持项目,第一步是作为孵化项目加入。LF AI & Data 将支持 Substra 的中立开放治理,以帮助促进项目的发展。在他们的GitHub[5]上了解更多关于 Substra 的信息,一定要加入Substra-Announce[6]和Substra-Technical-Discuss[7]邮件列表,加入社区并保持联系。
热烈欢迎 Substra 的到来!我们期待该项目作为 LF AI & Data 基金会的一部分继续增长和成功。要了解如何与我们一起托管一个开源项目,请访问LF AI & Data 网站[8]。
参考资料
[1]Substra: https://doc.substra.ai/index.html
[2]OWKIN: https://owkin.com/
[3]HealthChain: https://healthchain.io/
[4]MELLODDY: https://www.melloddy.eu/
[5]GitHub: https://github.com/Substra/substra
[6]Substra-Announce: https://lists.lfaidata.foundation/g/substra-announce
[7]Substra-Technical-Discuss: https://lists.lfaidata.foundation/g/substra-technical-discuss
[8]LF AI & Data 网站: https://lfaidata.foundation/proposal-and-hosting-process/

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Tapdata 获数千万美元 Pre-A 轮融资,专注实时数据服务平台
近日,主推面向 TP 业务实时数据服务平台的 Tapdata (深圳钛铂数据有限公司),宣布完成数千万美元 PreA 及PreA+连续两轮融资,两轮分别由五源资本独家领投及XVC及德联资本联合领投。 Tapdata 成立于2019年9月,由前 MongoDB 大中华区首席架构师,MongoDB中文社区主席唐建法(别名TJ)创建,早期核心员工来自MongoDB、Oracle、百度、阿里、腾讯等,并在成立之初获得极客公园旗下变量资本等天使机构近千万人民币天使轮投资。成立后的第二年,Tapdata 营收即超千万实现10倍增长,其产品“实时数据服务平台”获得了诸多行业标杆客户认可,包括中国移动、中国一汽、周生生、TCL、南方电网、富邦银行等。 聚焦实时数据即服务(Real Time DaaS)赛道,主打实时业务场景 企业在信息化和数字化建设过程中涉及到数据处理,一般分为两大阵营:OLTP和OLAP。OLTP 指的是Online Transaction Processing 事务型系统,关注的是交互式人机业务,如浏览电商网站,下单购买,转账,打车,内部流程等。而OLAP指的是Online Ana...
- 下一篇
趣说开源|为什么要参与到开源社区中?
你无法想象开源项目离你有多近。它早已融入你生活的方方面面,从办公室到家里,从健身房到餐厅等等。 俗话说:“开源项目属于我们,而不是我”,这就解释了为什么这些项目很受欢迎,以至于连知名的商业巨头都将开源计划纳入他们的商业计划中。但是对于普通人来说,到底是否有必要又是否有可能加入开源社区呢?它的魅力何在? 在这篇文章中,我将通过介绍优点和缺点来回答这些问题。我们都知道,奖励比惩罚更好,那我们就先从奖励开始说起。 01掌握一项新技能 你是否厌倦了每天疏远和重复的工作?你是否想学习新的、令人兴奋的、有价值的技能? 在线课程(MOOCs)或书籍绝对是提高你的技能和扩展你的知识的好方法。然而,我想推荐另一种高效,有趣的方法,那就是加入相关的开源社区,在生产环境中解决实际问题的同时学习新技能。这些活跃的开源项目之所以如此受欢迎,是因为它们帮助用户解决实际问题并满足他们的需求。通过参与开源社区,你学习到的是真正能解决现实生产上的实战知识,而不是书本上的条条框框与课本理论。 让我们以 Apache ShardingSphere 为例。Apache ShardingSphere 受到了全世界程序员和学生的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- 设置Eclipse缩进为4个空格,增强代码规范
- Hadoop3单机部署,实现最简伪集群
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- 2048小游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2更换Tomcat为Jetty,小型站点的福音