首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/IDP/blog/18692841

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

从数据到智能:北京人形揭秘跨本体VLA模型训练新范式

在近日举行的具身智能技术专题分享会上,北京人形机器人创新中心的研究员伍堃博士带来了一场内容丰富、干货满满的技术分享。作为来自雪城大学的PhD,伍博士专注于具身智能领域的研究,包括强化学习、模仿学习以及大规模数据集构建和VLA模型训练。本次分享系统性地介绍了团队从数据采集到模型训练的全链路创新工作。 突破数据瓶颈:构建大规模多模态数据集 伍博士首先指出当前具身智能领域面临的核心挑战——数据局限性。与互联网级别的海量文本和图像数据相比,机器人操作数据的规模要小得多,通常只有几万条轨迹,且采集成本高昂。现有的开源数据集以国外来源为主,如OpenX系列,虽然整合了多个实验室的资源,但存在标准不统一、任务简单、场景单一等问题,且大多局限于单臂机器人操作,与人类双手协同操作的灵活性相去甚远。 针对这些痛点,北京人形机器人创新中心联合北京大学和北京智源研究院推出了RoboMIND数据集。该数据集目前包含10万条高质量轨迹,涵盖479个多样化任务和96类物品,涉及单臂机械臂(如Franka、UR)、双臂机器人以及人形机器人(如天工机器人)等多种本体,末端执行器包括夹爪和灵巧手两种类型。 值得注意的是...

浏览器端音视频处理新选择:Mediabunny 让 Web 媒体开发飞起来 | 葡萄城技术团队

浏览器端音视频处理新选择:Mediabunny 让 Web 媒体开发飞起来 在 Web 开发中,音视频处理一直是个“老大难”问题:传统方案要么依赖后端服务器中转(延迟高、成本高),要么使用移植自桌面的库(体积大、性能差),始终缺乏一个“为 Web 而生”的轻量高效解决方案。而今天要介绍的 Mediabunny,正是填补这一空白的 JavaScript 库——它能直接在浏览器中实现音视频的读取、写入、转换,且速度和易用性都远超同类工具。 一、什么是 Mediabunny? Mediabunny 是一个专注于 浏览器端音视频全流程处理 的 JavaScript 库,核心定位是“为 Web 原生设计,而非移植适配”。它基于 TypeScript 开发,提供了从底层控制到高层封装的完整 API,让开发者既能精细操作媒体数据,又无需处理复杂的编解码细节。 简单说,它解决了三个核心痛点: 无需后端依赖:所有处理都在客户端完成,减少网络请求和服务器成本; 性能拉满:利用浏览器 WebCodecs API 实现硬件加速,配合“按需加载”“流水线设计”,速度远超同类库; 轻量且灵活:零依赖、支持树摇优化...

相关文章

发表评论

资源下载

更多资源
Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。