Alluxio Enterprise AI 3.5 发布,全面提升 AI 模型训练性能
近日,Alluxio 发布 Alluxio Enterprise AI 3.5 版本。该版本凭借仅缓存写入模式 ( Cache Only Write Mode )、高级缓存管理策略以及 Python 的深度集成等创新功能,大幅加速 AI 模型训练并简化基础设施运维,助力企业高效处理海量数据集、优化 AI 工作负载性能。
AI 驱动的工作负载常因海量的数据管理复杂度高导致效率瓶颈以及训练周期延长。Alluxio Enterprise AI 3.5 通过快速优先访问关键数据、无缝集成主流 AI 框架等优化手段来提升性能,从而加速模型开发。
"Alluxio Enterprise AI 最新版本推出多项创新功能,旨在进一步提升 AI 工作负载性能。" Alluxio 创始人兼 CEO 李浩源表示,“当前客户的 AI 模型训练已进入超大规模数据时代,数据集常涉及数十亿文件量级。为此,我们推出 Alluxio Enterprise AI 3.5 来保障训练任务达到峰值性能,同时简化 AI 基础设施的管理和运维。
全新缓存模式加速 AI Checkpoint
Alluxio 的仅缓存写入模式将 AI 模型训练过程中的 Checkpoint 文件等写操作数据直接写入 Alluxio 缓存层,绕过低效的底层存储系统(UFS),消除 I/O 瓶颈,从而提升写性能。( 预览功能 )
高级缓存驱逐策略提供细粒度的缓存控制 —— TTL 缓存驱逐策略
管理员可为缓存数据设置有效时间 ( TTL ),基于预设的策略自动驱逐低频访问数据,避免存储资源浪费。
高级缓存驱逐策略提供细粒度的缓存控制 —— 基于优先级的缓存策略
管理员可为关键数据集设置优先级,覆盖默认的 LRU ( 最近最少使用 ) 算法,确保高优先级数据保留在缓存中。这一策略尤其适用于低延迟访问关键数据集的工作负载。
基于 FSSpec 的原生 Python SDK,强化了与主流 AI 框架的集成
Alluxio Python SDK 现已基于 FSSpec 实现了 PyTorch、PyArrow 及 Ray 等主流AI框架的深度集成。该集成通过提供统一的 Python 文件系统接口,使应用程序能够以标准化方式无缝对接各类存储后端。对于采用 Python 开发、特别是承载数据密集型工作负载及 AI 模型训练的应用而言,这一改进大幅简化了 Alluxio Enterprise AI 的技术对接流程,使其能够轻松实现本地与远端存储系统的快速、高频访问。( 预览功能 )
同时,新版本也增加了以下关于 Alluxio S3 API 的关键优化:
支持 HTTP 持久连接 ( HTTP Keep-Alive )
通过复用单一 TCP 连接处理多个请求,减少每次请求新建连接的开销。针对 4KB 大小的 S3 ReadObject 读取操作,该优化可减少约 40% 的请求延迟。
TLS 加密传输
为 Alluxio S3 API 与 Worker 节点间通信提供 TLS 加密支持,确保数据传输安全。
分片上传 ( MPU ) 支持
Alluxio S3 API 现支持将大文件拆分为多个分片并行上传,显著提升大文件上传吞吐量,同时简化上传流程。
Alluxio 索引服务
该项新的缓存服务针对存储数亿级文件及子目录的超大规模目录结构,显著提升目录列表操作性能。通过从缓存中直接提供目录列表详情,相比查询底层文件系统 ( UFS ) ,可提供 3 至 5 倍的速度提升,有效保障海量元数据场景下的系统可扩展性。( 预览功能 )
UFS 读速率限制器
管理员可通过设置速率限制,来控制单个 Alluxio Worker 从UFS 读取数据时所使用的最大带宽。通过配置 UFS 读取速率限制器,管理员可以在确保系统稳定的同时,实现资源的优化利用。Alluxio 支持对包括 S3、HDFS、GCS、OSS 和 COS 在内的多种 UFS 类型进行速率限制。
支持异构 Worker 节点
Alluxio 现支持具有异构资源配置 ( CPU、内存、磁盘和网络 )的集群 Worker 节点。该增强功能为管理员在配置集群时提供了更大的灵活性,可实现更好的资源分配。
了解更多 Alluxio Enterprise AI 3.5 信息:https://documentation.alluxio.io/ee-ai-cn

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Apache Tomcat 11.0.4 发布
Apache Tomcat 11.0.4 现已发布,该版本针对 Jakarta EE 11。 公告提醒称:Tomcat 10 及以后版本的用户应注意,作为 Java EE 向 Eclipse 基金会转移的一部分,Java EE 已从 Java EE 迁移到 Jakarta EE,因此所有已实施 API 的主包已从javax.*变为jakarta.*。这几乎肯定需要修改代码才能使应用程序从 Tomcat 9 及更早版本迁移到 Tomcat 10 及更高版本。为此,官方提供了一个迁移工具。 此版本中值得注意的变化有: 修复 11.0.3 中的一个回归问题,并为InaccessibleObjectException添加一个捕获程序,以避免嵌入式 Tomcat 用户不得不额外添加--add-opens程序。 这些更改以及所有其他更改的完整详细信息均可在Tomcat 11 changelo中找到。 Download
- 下一篇
GNOME 48 Beta 发布:默认 Adwaita 字体、引入新的显示控制工具 gdctl……
GNOME 48 Beta 测试版已发布,这是 3 月中旬正式版发布前的重要里程碑。 值得关注的变化: GNOME Web 浏览器(Epiphany)对其导入对话框进行了现代化改造。 GNOME Backgrounds 为 GNOME 48 更新了默认背景。 GNOME Builder 带来了风格改进,以匹配 libadwaita,更好地与 Elementary 集成,以及其他各种改进。 GNOME 日历现在允许选择事件开始和结束时间的时区。 GNOME 地图重新设计了用户位置标记,并改进了路线标记和公共交通路线行程的渲染。 GNOME 音乐增加了对 HiDPI 专辑封面的支持。 GNOME 远程桌面现在支持使用 Vulkan 和 VA-API 视频加速的零拷贝渲染。 GNOME Shell 48 测试版增强了对新 GNOME 48 特性屏幕时间限制的支持。 GNOME 软件现在支持通过 flatpak+https: 链接安装 Flatpak。 GNOME 文本编辑器在其设计更新上进行了更多改进。 默认切换到 Adwaita 字体。 GTK 4.17.4 工具包为 Android 设备...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G