类似 Git 的文件对象存储 —— LakeFS
LakeFS 是一种开源工具,可将你的对象存储转换为类似 Git 的存储库;它使你能够以管理代码的方式管理数据湖。
使用 LakeFS,你可以构建可重复的、atomic 和版本化的数据湖操作 - 从复杂的 ETL 作业到数据科学和分析。
LakeFS 支持 AWS S3、Azure Blob Storage 和 Google Cloud Storage 作为其底层存储服务。它与 S3 的 API 兼容,并与所有现代数据框架(如 Spark、Hive、AWS Athena、Presto 等)无缝协作。
特性:
- 百万亿规模的版本控制
- 类似于 Git 的操作:branch、commit、merge、revert
- Zero copy branching 用于 frictionless 实验
-
数据和代码的完全可重复性
-
用于 data CI/CD 的 Pre-commit/merge hooks
-
即时恢复对数据的修改

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
英特尔开源基于机器学习的代码检测工具 ControlFlag
去年,英特尔推出了一个基于机器学习的代码检测工具 ControlFlag,可以帮助开发者发现代码中的错误,减少调试应用程序和软件所需的时间。英特尔在用超过 10 亿行的代码对 ControlFlag 进行训练后取得令人印象深刻的结果,ControlFlag 在已达到 "生产质量" 的软件中发现了数百个错误,证明了其在代码检测方面的实用性。而且在去年年底,英特尔就已将该工具部署至公司内部,用于检查从固件到软件应用的代码库。 如今时隔一年时间,英特尔又带来了有关 ControlFlag 的新消息,现在英特尔将 ControlFlag 正式开源,以帮助更多开发者自主检测代码错误。 ControlFlag 适用于任何包含控制结构的编程语言(如 C/C++),旨在通过利用无监督的学习方式减少调试工作。通过无监督学习,一个算法被置于 "未知" 数据中,ControlFlag 能够自己对数据进行分类、处理未标记的数据,并从其固有的结构中学习。 ControlFlag 能够不断地从未标记的源代码中学习,随着新数据的引入而 "进化",使自己变得更好。虽然它还不能自动解决它所发现的代码错误,但该工具可以...
- 下一篇
开发者验证移除 CPython GIL 可行,可显著提高多线程性能
一位名叫 Sam Gross的开发者提出了一个对全局解释器锁(GIL)进行重大修改的设想。其目标在于移除 CPython 中的 GIL,以使得多线程能够并行执行 Python 代码。目前,该项目已经引起了 Python 核心开发团队的关注。 我一直在对 CPython 进行修改,使其能够在没有全局解释器锁的情况下运行。我想与大家分享一个可以在没有 GIL 的情况下运行的概念验证。这个概念验证涉及到对 CPython 内部的大量修改,但对 C-API 的修改相对较少。它可以与许多 C 语言扩展兼容:扩展必须被重建,但通常只需要对源代码进行较小的修改或不需要修改。我已经从科学的 Python 生态系统中构建了兼容的软件包版本,它们可以通过捆绑的"pip"来安装。 Gross 在设计文档中详细列举了移除GIL 需要承担的一些风险以及他认为要移除 GIL 的理由: 风险 移除 GIL 将是一项大型、多年的任务,引入错误和回归的风险会增加。 移除 GIL 意味着在单线程和多线程性能之间进行权衡。“我相信 - 我们可以创建一个没有 GIL 的 CPython,它在单线程和多线程工作负载方面都比当前...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池