Meta 发布开源世界模型 V-JEPA 2
Meta发布了最新的开源世界模型V-JEPA 2,称其在物理世界中实现了最先进的视觉理解和预测,从而提高了AI agents的物理推理能力。
开源地址:https://github.com/facebookresearch/vjepa2
官网地址:https://ai.meta.com/vjepa/
论文地址:https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/
V-JEPA 2是一种联合嵌入预测架构(Joint Embedding Predictive Architecture)模型,这也是“JEPA”的名称由来。
据介绍,V-JEPA 2的核心架构是一个自监督学习框架,通过互联网规模的视频数据来训练模型,使其能够学习到视频中的动态和静态信息。预训练阶段使用了超过100万小时的视频和100万张图像,这些数据涵盖了各种动作和场景。预训练的目标是让模型能够通过观察学习到世界的背景知识,而无需依赖于大量的标注数据。
值得一提的是,图灵奖获得者、Meta首席科学家杨立昆(Yann LeCun)参与了该模型的开发,这在Meta开源的众多大模型中很罕见。他在官方视频中提到,在世界模型的帮助下,AI不再需要数百万次的训练才能掌握一项新的能力,世界模型直接告诉了AI世界是怎样运行的,这可以极大提升效率。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Liquid Glass React —— 「液态玻璃」的 React 实现
Liquid Glass React 是苹果“液态玻璃(Liquid Glass)”设计语言的 React 实现。 特性 良好的边缘弯曲和折射 多种折射模式 可配置的冰霜级别 支持任意子元素 配置的填充 修正悬停和点击效果 边缘和高亮会像苹果一样呈现底层光线 可配置的色差 可配置的弹性参数,以模仿苹果的"液体"触感
- 下一篇
《智能体网络协议技术报告》发布
W3CAI Agent Protocol社区组于今年5月成立,致力于孵化下一代智能体之间的交互协议,让智能体能够在互联网上使用协议进行高效的连接与协作,推动智能体在Web上的安全、高效、可信连接与协作。 小组现发布《智能体网络协议技术报告》:https://w3c-cg.github.io/ai-agent-protocol/ 另见该报告的中文翻译参考:https://w3c-cg.github.io/ai-agent-protocol/index_cn.html 这份报告探讨了从语义网(Semantic Web)的未竟愿景到智能体网络(Agentic Web)的演进历程,并分析了构建标准化智能体网络协议的必要性。 尽管二十年前提出的语义网构想极具前瞻性,但受限于当时人工智能技术的能力不足,未能充分实现。随着大型语言模型(LLMs)等现代AI技术的飞速发展,智能体已具备自主执行任务、进行复杂推理和解决多步骤问题的能力,从而催生了Agentic Web的出现。 通过系统分析,该报告给出智能体网络的四大核心趋势:智能体取代传统软件成为互联网基础设施、智能体间实现普遍互联互通、基于协议的原生...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Mario游戏-低调大师作品
- Docker安装Oracle12C,快速搭建Oracle学习环境