首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/228194

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里鄢志杰博士:“达摩院”要做下一代颠覆性的人机交互

人机之间的自然交互一直是人工智能领域的一个美好愿景,而语音是人机交互中最重要的手段之一。随着人工智能的迅速崛起,新一轮语音技术变革已经跃然眼前,成为科技巨头们争相攻下的堡垒。 近日,飞象网记者对阿里iDST (Institute of Data Science and Technologies) 智能语音交互团队总监鄢志杰博士进行了专访,从阿里iDST发展战略、平台建设、自然人机交互技术等多角度揭开阿里智能语音交互的神秘面纱。 “达摩院”要做下一代颠覆性的人机交互 PC时代,人们与机器通过键盘和鼠标交流,与机器“沟通”需要学会打字、按键操作;移动互联网时代,人们与智能手机通过触摸屏幕交流,只需滑一滑手指即可完成任务;未来智能时代,机器将更像人类的一员,与它之间的交互方式将更趋同于与人之间交互。而要做到像“人”一样交流,机器就必须具备语音

机器视觉技术背后的行业趋势

机器视觉是唯一能够通过非接触的方式识别物体、观测物体的技术,在各个领域都具有难以替代的独特作用。同时,机器视觉这个领域包含了大量的细分技术领域,对于新技术的探索和研究也从未停止脚步。 3D机器视觉系统.jpg 在智能生活领域,机器视觉的主要作用是为机器提供物体识别的功能;在智能制造领域,机器视觉广泛应用于物体的检测、测量、识别(识别条形码、二维码)、工业机器人的定位。其中,智能生活领域识别物体的难点主要在于识别目标的覆盖范围的扩大,包括识别成功率的提高,以及样本库的训练;而智能制造领域中,工业机器人的定位是所有功能中相对较难的一种,由于对于作业精度和作业速度的需求,该功能的难点主要在于标定(图像坐标系与外部坐标系的映射)精确度与标定速度的提升,定位过程中的精确度与速度的提升等。 为了赋予机器人眼识别物体的功能,机器视觉一般需要经历图像获取、预处理、特征提取、分析理解、图形匹配的过程,最终得到对于图像信息的解释和描述。其中,预处理是将图像进行变换、增强、去噪、均衡、复原等处理;特征提取是从图像信息中提取能够构成目标形象的关键特征,如几何特征(角点、不变量)、颜色特征(灰度、突变)、Gab...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。