研究室秒变后厨,TensorFlow被馋哭!日本团队用深度学习识别炸鸡,救急便当工厂
云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
在韩国最受欢迎的外卖食品是什么?
答案毋庸置疑,一定是炸鸡!
根据韩国外卖订购软件公布的的统计数据显示,炸鸡今年再次当选韩国“最受欢迎的外卖食品”,从2014年起就一直霸占着冠军宝座,简直是小食界难以逾越的高峰。
无独有偶,在美国,炸鸡文化也长盛不衰,肯德基双层炸鸡堡唯一不限供应的地区就是美国。根据前德州监狱后厨Brian D.Price回忆,“70%的囚犯最后一餐都会要求吃油炸食品”。
那么,炸鸡和TensorFlow两者结合,你又能想到什么?
最近,日本一个机器人公司RT CORPORATION开发了一个叫Foodly的机器人,机器人上配置的图像识别系统就是用的TensorFlow,Foodly不仅能准确识别单块和多块炸鸡,还能将刚出锅随意摆放的炸鸡块规整地放在便当盒内。
为了完成这个识别功能,研究团队也很拼,每天在实验室现炸鸡块,炸累了点炸鸡外卖,简直就是变成了炸鸡加盟店!
Foodly的开发也很好地贴合了疫情当下便当工厂不能大范围复工的现状,从下图中可以看到,Foodly的大小和与成人类似,能在便当工厂的生产线上与人并排工作。
能看不能吃,TensorFlow都要馋哭了!
说到这,掐指算算,已经有多久没吃过炸鸡了?不妨咽下口水,先和文摘菌一起就着这篇文章“画饼充饥”一下,中午就去激情下单炸鸡外卖吧!
为了研发Foodly,他们活生生把公司搞成了炸鸡加盟店
虽然好吃又馋人,但是炸鸡块在图像识别界可没那么招人待见。
炸鸡爱好者们都知道,你徒手拿起的每块炸鸡形状是何其相似,更别说要在炸鸡堆中准确区分每块炸鸡的边界,这些都是图像识别研究者们内心拒绝炸鸡的原因。
据闻,坊间流传着这么一个说法:炸鸡块是图像识别最难逾越的高峰。
但是现在有了Foodly,再难的炸鸡识别都是小菜一碟!识别效果如下图所示:
整堆炸鸡块被识别成一个整体
每一块炸鸡块被单独识别
据研究者透露,之前尝试过其他的机器学习框架,但看到有人利用TensorFlow成功对猫的照片进行分类后,就按捺不住内心的躁动了。
光想不做可不行,紧接着,研究团队对CNN的相关论文进行了阅读和学习,并进行了进一步的物体检测。
那时正好是初代Foodly发布初期,在对系统前期表现相当满意的情况下,研究者们拿出究极武器——炸鸡,可以看到,初代系统能够将图像的一部分切成矩形,然后以矩形为单位对炸鸡块进行识别。
虽然初代系统的表现就已经很不错了,但是研究团队表示还存在很多不足,比如识别时间太慢,识别一块炸鸡要一分钟左右,一分钟炸鸡骨头都被吸干了还识别个啥!再比如,初代系统还只能识别单块炸鸡,成堆的炸鸡识别还有待进一步地改进。
同时,为了养活这么一个系统,可真是“难哭”了研究团队,那个时期他们在公司现炸鸡块,炸累了点炸鸡外卖,简直就是把公司当成了炸鸡加盟店!
当然这都不是最难的,最难的是要在下嘴之前先把图像数据存储下来。这么下来,他们最终收集到了大概400~500张规范的炸鸡照片,700多张不那么规范的照片。
在那些不规范的照片中,有一些还故意拍到了人手,这也是有研究考量的。因为人手和炸鸡成色很像,形状也像,如果系统错误地对人手进行识别的话那可就大事不妙了。
Foodly进化史:从R-CNN起家,炸鸡块表面的凹凸纹路也不能放过
可以想见,开发Foodly可不是这么简单的事。
其实Foodly的前身还不叫Foodly,而是NEKONOTE,由一个扶手和安装在顶部的照相机组成,虽然看上去像是工业用机器人的形状,但是即使加上照相机用的框架,大小也能控制在一个人的样子。
2016年6月,NEKONOTE在“TensorFlow学习会”上发表,在德国CEBIT 2017上公开亮相。出道舞台虽然足够有分量,但还是出师不利,当场就有不少人对NEKONOTE提出质疑,有人认为NEKONOTE只使用一只手,太可怕了,有人认为在食材正上方放置摄像头,可能会污染食物,还有人针对NEKONOTE的照相机和手臂的位置关系,指出手臂的摆动可能会影响到视线和识别效果。
CEBIT 2017上展出的NEKONOTE
综合了这些提议之后,研究者认为,或许应该把它设计成人型,于是NEKONOTE就摇身一变,变成了现在的Foodly。
当然这个过程可不只是外观的变化,升级归来的Foodly不仅能识别单块炸鸡,还能从堆积的炸鸡中检测出每一块炸鸡。
识别效果的提高也是多方面促成的,首先识别标准从矩形识别变成了轮廓识别,这其中主要用到的就是从R-CNN发展而来的Mask R-CNN技术,其次,Foodly使用了可以识别炸鸡纹路的深度摄像机,炸鸡块表面的凹凸纹路也作为特征被引入了深度学习,提高了识别精度。
根据深度摄像机提供的影像学习凹凸特征
几代系统迭代发展下来,研究者总结了用TensorFlow进行炸鸡识别的心得,汇总成了下面这张从理论学习到推论的流程图:
首先是制作监督数据集的阶段。用位于Foodly头部的深浅相机拍摄颜色和深浅的图像(RGB-D图像),然后将其放入个人电脑进行标注,指定炸鸡块的位置。在标注上,团队也制作了专门的工具使其尽可能的自动化。
在接下来的学习阶段,以既有的公开训练成果模型为基础,通过TensorFlow进行转移学习,制作食材检测用的模型。转移学习的引入也让几百张的图像工作量锐减到了几十张。
但是,既有的训练成果的模型只能输入RGB的3个通道,为了能够对应RGB-D图像,需要将输入层变更为4个通道才能进行再学习。
最后,把做好的模型转移到机器人上,就可以检测出炸鸡块。在搭载压缩GPU的边缘的AI板Jetson TX2上执行推理过程。
顺便一提,Foodly的目标是可以直接拿到便当工厂的生产线上使用。因此,根据工厂的不同,照明的程度也不同,增加了识别的难度。常见的对策通常是准备专用的光源,不过,Foodly在训练阶段就适用了多样的光度,因此即使没有专用的光源也能能稳定的进行识别。
以上就是关于识别炸鸡块的整个流程,以实用的速度检测炸鸡块,然后将其放入便当盒的操作现在已经很稳定了。公司现在也把目光对准了其他的食物,比如番茄,相比于炸鸡,要让机器人把番茄放入便当盒而不让其碎掉,还必须调整机器人的力度,这就是另一个需要解决的问题了。
RT公司:机器人是未来社会的引路者
可别再说Foodly是日本人民的脑洞发明了。
Foodly可是瞄准了当下便当工厂人手不足的现状,尤其是疫情之下,为了降低感染风险,Foodly可以代替人加入生产线,而且,表现不比人差。
考虑到大多数便当工厂的工作场所都是在60~90cm的空间内,目前工业机器人还有几方面问题需要重点考虑:硬件上希望即使有人不可避免地碰撞到Foodly也不造成擦伤,软件上,即使在没有预设的情况下,也能正常识别,除此之外,便当工厂流水线的菜单每小时会改变2~3次,便当盒尺寸存在差异,流动速度也有不同等等。
这些不确定因素在Foodly面前全都迎刃而解,而且,Foodly操作也十分简单,不需要专家进行任何复杂的安装和调整,马上就能上工,可以说是工厂福音了。
好奇之下,文摘菌还去查了查开发Foodly的公司到底是什么来头,结果发现,这家叫做RT CORPORATION的公司完全就是一个机器人迷公司嘛!
先不说公司的理念是“life with robot”,公司名字RT是Robot Technology的缩写,公司的兔子logo来源参考了《爱丽丝梦游仙境》,官网介绍道,在小说中,兔子是爱丽丝抵达仙境的引路人,与此相对应的,在现实中,机器人就是未来生活的引导者。
除了实用机器人如Foodly的开发,RT公司也对机器人工程的教育事业十分关注。
公司认为,在现在和未来,培养优秀的机器人工程师都将是重要的社会使命。RT公司从硬件和软件等多个角度提供产品和服务,为培养实用型机器人工程师做足了功课。
作为教育工作的一部分,公司将提供自主研发装配的机器人用于学习和参考,同时,在这些机器人的帮助下,公司有能力举办研讨会等学习活动,为更多的人提供学习机会。
如今,机器人在社会生活中扮演着越来越重要的角色,工厂流水线上运行的大型工业机器人不断发展,家用小型机器人同样不断演变着,机器人已经到了能够与人合作、并肩作战的阶段。
相信机器人引领我们前往的未来不会太遥远。
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK
原文发布时间:2020-04-20
本文作者:李欣月、刘俊寰
本文来自:“大数据文摘公众号”,了解相关信息可以关注“大数据文摘”
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
爬虫管理平台 Crawlab v0.4.10 发布
前言 本次更新包括几个部分: 日志集中管理 自动安装依赖 开放 API Web Hook 自动生成结果集 更新日志 功能 / 优化 优化日志管理. 集中化管理日志,储存在 MongoDB,减少对 PubSub 的依赖,允许日志异常检测. 自动安装依赖. 允许从requirements.txt和package.json自动安装依赖. API Token. 允许用户生成 API Token,并利用它们来集成到自己的系统中. Web Hook. 当任务开始或结束时,触发 Web Hook http 请求到预定义好的 URL. 自动生成结果集. 如果没有设置,自动设置结果集为results_<spider_name>. 优化项目列表. 项目列表中不展示 "No Project". 升级 Node.js. 将 Node.js 版本从 v8.12 升级到 v10.19. 定时任务增加运行按钮. 允许用户在定时任务界面手动运行爬虫任务. Bug 修复 无法注册.#670 爬虫定时任务标签 Cron 表达式显示秒.#678 爬虫每日数据缺失.#684 结果数量未即时更新.#689 产品规划...
- 下一篇
【云栖号案例 | 教育与科研机构】掌门1对1上云 你的专属老师在线上等你 教育没有疫情
云栖号案例库:【点击查看更多上云案例】不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策! 随着全国各地教育主管部门相继推出教育防疫方案,如何帮助孩子实现在家上课成为当务之急。 1月27日,掌门教育面向湖北地区中小学生捐赠价值2000万元1对1直播课程,帮助当地孩子们顺利实现“云”学习,并承诺将全面保证疫情期间的教学和服务品质,携手社会各界共同打赢这场看不到硝烟的战争。 全国线上课堂上线之后,从传统线下教学直接搬到线上的挑战逐渐显露出来,比如网络卡顿、基础资源不足造成的系统性宕机、无法直接互动反馈、无法保证教学质量等等…… 而中国商业化线上教育在过去的两年刚刚经历过的风口,催生了一整套完整的技术解决方案,具有很大的借鉴价值。 以在K12在线1对1全科辅导领域用户份额近八成的掌门1对1(掌门教育旗下知名品牌)为例,其拥有超过10000名教研员,服务遍布全国 600 多个省市县,让一线城市优质教育资源共享到更多偏远地区和贫困地区。 掌门1对1在6年的发展过程中,是如何应对IT基础资源、网络速度、师生互动、因材施教等线上教育挑战,从而让在线教育回归平等普惠和个...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器