智元发布「灵创」平台,0 代码、0 门槛训练机器人
智元机器人宣布正式推出全球首个0代码、0门槛的机器人内容创作平台——「灵创」平台。以“让创作更简单,让表达更灵动”为核心理念,首次将AI动作捕捉、云端模仿学习与多模态编排能力深度融合,面向普通用户开放人形机器人内容创作的无限可能。
“无需编程基础、无需专业设备,只需上传一段人类动作视频,用户即可通过「灵创」平台实现从真人表演到机器人精准复刻的端到端转化。从此,每个人都能成为机器人的“导演”和“编舞师”,轻松打造属于自己的机器人表演作品。”
根据介绍,通过AI视觉动作提取、智能重定向算法与高效云端模仿学习框架,平台实现了人类行为到机器人控制策略的自动化生成。无论是舞蹈、武术还是日常交互动作,用户只需一部手机拍摄视频上传,即可让机器人“学会”并精准演绎。
且「灵创」平台的动作模仿功能,不仅可以完成肢体动作复刻,未来也可以实现手指级别精细动作的模仿与展现。
除根据视频模仿生成动作外,「灵创」平台还为用户提供了“语音演绎”功能,该功能为用户提供了音频上传、在线录音和语音合成三种模式。
用户上传文本内容或音频后,“语音演绎”功能会智能识别语义,并利用多模态大模型生成与语音内容匹配的机器人肢体动作与表情,从而实现自然拟人表达。
“语音演绎”的语音合成为用户提供了音色、情绪可定制化能力,系统提供了男性、女性以及自定义音色类型,用户可以自由选择自然生动的音色、情绪表达,能够保证机器人的语气更贴近场景,提升机器人动作、语音和表情演绎表达时的情感力与沉浸感。
同时,「灵创」平台打造了动作混剪、组合与故事线编排功能,帮助用户做“导演”,让用户像剪视频一样,完成长程表演中的叙事化动作设计。
该功能支持用户利用多个动作,像剪辑视频一样编排机器人声音、动作与表情,精准控制每一帧动作节奏,为机器人设计丝滑过度的连续动作组合展示,堪称机器人动作设计领域的“剪映”。
「灵创」平台为用户提供了官方素材库,涵盖11类场景超过180套标准化动作与140套表情模板,用户可以从素材库中直接调用动作、表情进行动作组合创作。
智元方面表示,除了开放技能创作平台「灵创」,其还将于下个月上线机器人的个性化性格定义平台「灵心」
关注公众号
					低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 
							
								
								    上一篇
								    
								
								AI 编程热潮下的万字思考 - 规避风险,善用其利
编者按: 在 AI 技术席卷软件工程的今天,我们是否真的可以仅凭"氛围"和直觉,就构建出可靠、安全且可维护的生产级系统? 我们今天为大家带来的这篇文章,作者的核心观点是:"氛围编程(vibe coding)"与"AI 辅助的工程实践"存在本质区别,前者虽在创意激发和快速原型中具有价值,但绝不能替代结构化的工程方法。 文章通过多个维度深入探讨了这一观点:从 FAANG 团队的实际工作流程切入,指出真正的 AI 辅助的工程实践是在严格的设计、审查和测试框架内使用 AI 作为"效能倍增器"。继而以维恩图形象对比了"氛围编程者"、"竞技牛仔"和"困局囚徒"三类开发者原型,警示过度自由或过度约束都将阻碍可持续开发。最后还结合 CTO 调研和社区讨论,指出盲目依赖 AI 生成的代码可能导致安全漏洞、性能崩溃与可维护性灾难,并提出了"规范驱动开发"和"Agentic AI"等更负责任的工作流程建议。 作者 | Addy Osmani 编译 | 岳扬 氛围编程(vibe coding)并不等同于 AI 辅助的工程实践。近期一则 Reddit 帖子[1]描述了某 FAANG 团队如何使用 AI,由此引发...
 - 
							
								
								    下一篇
								    
								
								QCon·上海站HarmonyOS开发者技术分论坛:共探鸿蒙开发新机遇
当前,AI 技术重构开发逻辑、多设备协同成为技术主流,鸿蒙开发能力正迎来从“能用好用”到“实用便捷”的关键跃迁。10月24日,2025年QCon全球软件开发大会上海站HarmonyOS开发者技术分论坛(以下简称“论坛”)成功举办,论坛聚焦 AI 实践落地与技术赋能,邀请多位华为技术专家深度解读并分享 HarmonyOS AI辅助开发能力、多设备适配解决方案、场景化赋能、性能调优、场景能力共建以及React Native性能优化等方面的实战内容,帮助开发者快速了解前沿鸿蒙开发技术,提升开发方案竞争力,共探鸿蒙生态新机遇。 拥抱多设备:一次开发、多端部署 随着智能终端形态从直板手机拓展到上下折、左右折、三折设备以及平板、PC和智慧屏,开发者需要面对前所未有的适配复杂度与多栈维护压力。华为终端BG开发者平台能力首席架构师分享了鸿蒙在多设备开发领域的能力建设:通过“一次开发,多端部署”提供归一化的系统能力,借助不同跨平台框架的断点适配、自适应布局容器以及归一化交互事件等能力,告别不同窗口尺寸场景和不同交互设备场景的重复开发流程,帮助开发者快速完成应用开发;IDE中提供多设备预览器和模拟器,加...
 
相关文章
文章评论
共有0条评论来说两句吧...

			
				
				
				
				
				
				
				
微信收款码
支付宝收款码