北京人形提出具身智能策略框架 FreqPolicy
北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)发文宣布,其团队研发的具身智能策略框架 FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency,成功入选人工智能领域顶级会议 NeurIPS。
根据介绍,FreqPolicy 框架的核心创新在于:首次引入频谱一致性约束,从频域角度重构具身智能机器人动作的时间建模方式。通过在策略生成过程中引入时序信息的频域表达,FreqPolicy实现了“一步生成高效动作流”,显著提升了具身智能机器人操作的效率与连贯性。
在AI全面走向物理世界的背景下,该项工作面向高效具身操作进行研究,通过一步生成机制,大幅提升动作预测频率和控制频率,满足具身智能机器人系统对于高响应性场景的要求,适用于动态环境、自适应操作等高复杂度场景。
FreqPolicy 将动作块(action chunk)通过DCT-II变换映射到频域空间中进行一致性约束,以更好地捕捉动作的时域特性。同时,FreqPolicy额外设计了一个频域分量的自适应关注策略,使得FreqPolicy在一致性约束中灵活关注重要频段。通过上述策略,FreqPolicy学习到了更优的转移轨迹,最终实现了由噪声到目标动作的一步生成。
在仿真基准中,FreqPolicy显著提升了一步流匹配策略的操作性能。相较于之前的一步动作生成方法SOTA性能,FreqPolicy在Robomimic测试基准上的平均性能提升了6%,在MetaWorld测试基准上的平均性能提升了8.9%。此外,当与OpenVLA等VLA模型相结合时,FreqPolicy能够在不损害操作性能的前提下,将推理速度提高至原来的5倍。
在真实场景应用中,FreqPolicy可以广泛适用于桌面操作、家居服务和工业作业等场景,取得了比标准扩散策略和标准流匹配策略更高的任务成功率,同时其推理频率提升了3-5倍。
未来,北京人形计划进一步优化该方法,同时提升其多峰分布建模能力和推理速度,并探索其在更复杂场景下的应用。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
京东发布开源大模型安全框架 JoySafety
京东宣布正式开源大模型安全框架 JoySafety,该框架在京东内部广泛应用,覆盖AI导购、物流客服、销售助手、医疗问诊、商家工作台、法务咨询、安全问答等场景,支持日均亿级调用、95%+攻击拦截率,致力于为企业提供一套成熟、可靠、免费的大模型安全防护方案。 JoySafety 核心技术亮点 大模型多轮会话智能识别 采用Free-Taxi异步输出模式,大幅提升检测响应, 实现用户体验与安全的完美平衡 多维响应策略矩阵 🎯精准拦截- 高风险内容即时阻断 ⏸️红线代答- 红线知识库应答 🔄智能纠偏- 自动引导正向回答 JoySafety开源地址 https://github.com/jd-opensource/JoySafety https://huggingface.co/jd-opensource/JSL-joysafety-v1
-
下一篇
苹果“抗争”无果,欧盟委员会力挺《数字市场法案》
外媒消息称,尽管苹果公司强烈抱怨欧盟的《数字市场法案》(DMA)给欧洲iPhone用户带来了更糟糕的体验,但欧盟委员会却明确表示,无意废除这一法案。 报道指出,《数字市场法案》作为欧盟的一项重要法律,旨在规范苹果等科技巨头的运营行为,防止其不公平地偏袒自身服务、封锁竞争对手以及限制用户选择。然而,自该法案实施以来,苹果公司便几乎对其每一条规定都提出了异议。 法国24小时新闻电视台报道,欧盟数字事务发言人托马斯·雷尼耶在一份声明中表示,欧盟委员会对苹果公司的申诉并不感到意外,并且“绝对没有”废除《数字市场法案》的打算。他强调,如何执行该法案以及由谁来执行,将由欧盟委员会决定。 苹果公司则坚称,《数字市场法案》的规则使欧盟iPhone用户面临恶意软件、欺诈和隐私侵犯的风险。该公司还表示,该法案迫使其推迟了实时翻译、iPhone镜像功能以及地图应用中的“常去地点”和“偏好路线”等关键功能的推出。 然而,雷尼耶对此并不认同。他指出:“《数字市场法案》中没有任何条款要求公司降低其隐私标准或安全标准。” 相关阅读: 苹果发文反对欧盟《数字市场法》
相关文章
文章评论
共有0条评论来说两句吧...