“北京人形”全面开源具身智能 VLM 模型:Pelican-VL 1.0
北京人形机器人创新中心全面开源具身智能VLM模型——Pelican-VL 1.0。该模型覆盖7B、72B参数规模,是迄今为止“最大规模的开源具身多模态大模型”,同时,也是迄今为止全球性能最强大的具身智能VLM模型。根据测试,其性能超越GPT-5 同类模型15.79% ,与Google gemini 系列模型相比提升19.25%,同时也超越通义千问、书生万象等国内模型,成为了目前最强的开源具身多模态大模型 。
另外值得注意的是,Pelican-VL的核心主创团队都是由女性组成,这也充分体现了女性力量在我国科技研发中的重要贡献。该团队还提出了一套全新的DPPO(刻意训练)训练范式,是全球首创的具身多模态大模型后训练自进化算法框架。凭借DPPO,Pelican-VL 实现【性能最强】这一目标使用的数据量为200K,仅仅是其他大模型的1/10甚至1/50,是名副其实的开源VLM性价比之王。
Pelican-VL 1.0 的开源,能够大幅提升具身智能在商业服务、工业泛工业、高危特种作业、家庭服务等多种真实场景中,通过视觉-语言感知辅助多步任务规划的能力。而VLM作为目前实现机器人全自主的核心,Pelican的开源也将推动我国具身智能全自主发展。
开源主页
https://pelican-vl.github.io/
https://github.com/Open-X-Humanoid/pelican-vl
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Cursor 一年三轮融资,总额突破 33 亿美元
Cursor(母公司为 Anysphere)宣布完成 23 亿美元 D 轮融资,投后估值跃升至293亿美元。“这笔资金将使我们得以加大对研究的投入,打造 Cursor 的下一个'魔法时刻'。” 将近两年前我们完成种子轮融资时,我们写道: 在接下来的几年里,我们希望打造一款前所未有、更加有用、令人愉悦且充满乐趣的代码编辑器。Cursor 应该是一个让你根本写不出 Bug 的地方;一个只用 50 行伪代码就能“编出”一份 2,000 行 PR 的编辑器;一款能即时解答任何代码库问题的工具;甚至,或许是一个让源代码本身逐渐“隐去”的交互界面。 看到这一愿景的早期雏形逐步成形,令人振奋。 本轮融资除现有投资方Accel、Thrive、Andreessen Horowitz 和 DST外,还有Coatue、NVIDIA 和 Google作为新投资者加入。目前,团队已扩充至 300 多名工程师、研究员、设计师与运营人才,并计划进一步拓展版图。其年化收入也已突破 10 亿美元。 事实上,这是 Anysphere 近一年内完成的第三次融资,包括:2024 年 12 月完成了 1.05 亿美元的 B 轮...
-
下一篇
腾讯回应 AI 支出低于预期:GPU 充足,足以满足内部需求
腾讯日前发布了2023年第三季度的财报,虽然整体营收和利润大幅增长,但却透露出资本开支低于市场预期的消息,引发外界对其 AI 项目的关注。腾讯总裁刘炽平在财报发布后的电话会议上对此作出了详细解释。 刘炽平指出,尽管资本开支少于预期,但腾讯在 GPU(图形处理单元)的储备方面没有问题。他强调,目前公司的 GPU 充足,能够满足内部的需求,特别是用于 “元宝” 项目的开发。关于云业务,刘炽平提到,目前的外部收入仍然受到一些限制,但这并不会影响腾讯在 AI 领域的持续投入和发展。 在谈到 “元宝” 项目的未来时,刘炽平表示,腾讯在团队建设和基础设施方面已经做出了很多改进,人员和资源的增加将为后续的发展奠定良好基础。他期待着新的模型能够带来 “有意义的改进”,并相信腾讯在混元能力上的提升速度将进一步加快。
相关文章
文章评论
共有0条评论来说两句吧...




微信收款码
支付宝收款码