研究室秒变后厨，TensorFlow被馋哭！日本团队用深度学习识别炸鸡，救急便当工厂-低调大师

研究室秒变后厨，TensorFlow被馋哭！日本团队用深度学习识别炸鸡，救急便当工厂

2020-04-20 570 89

云栖号资讯：【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！

在韩国最受欢迎的外卖食品是什么？

答案毋庸置疑，一定是炸鸡！

根据韩国外卖订购软件公布的的统计数据显示，炸鸡今年再次当选韩国“最受欢迎的外卖食品”，从2014年起就一直霸占着冠军宝座，简直是小食界难以逾越的高峰。

无独有偶，在美国，炸鸡文化也长盛不衰，肯德基双层炸鸡堡唯一不限供应的地区就是美国。根据前德州监狱后厨Brian D.Price回忆，“70%的囚犯最后一餐都会要求吃油炸食品”。

那么，炸鸡和TensorFlow两者结合，你又能想到什么？

最近，日本一个机器人公司RT CORPORATION开发了一个叫Foodly的机器人，机器人上配置的图像识别系统就是用的TensorFlow，Foodly不仅能准确识别单块和多块炸鸡，还能将刚出锅随意摆放的炸鸡块规整地放在便当盒内。

为了完成这个识别功能，研究团队也很拼，每天在实验室现炸鸡块，炸累了点炸鸡外卖，简直就是变成了炸鸡加盟店！

Foodly的开发也很好地贴合了疫情当下便当工厂不能大范围复工的现状，从下图中可以看到，Foodly的大小和与成人类似，能在便当工厂的生产线上与人并排工作。

能看不能吃，TensorFlow都要馋哭了！

说到这，掐指算算，已经有多久没吃过炸鸡了？不妨咽下口水，先和文摘菌一起就着这篇文章“画饼充饥”一下，中午就去激情下单炸鸡外卖吧！

为了研发Foodly，他们活生生把公司搞成了炸鸡加盟店

虽然好吃又馋人，但是炸鸡块在图像识别界可没那么招人待见。

炸鸡爱好者们都知道，你徒手拿起的每块炸鸡形状是何其相似，更别说要在炸鸡堆中准确区分每块炸鸡的边界，这些都是图像识别研究者们内心拒绝炸鸡的原因。

据闻，坊间流传着这么一个说法：炸鸡块是图像识别最难逾越的高峰。

但是现在有了Foodly，再难的炸鸡识别都是小菜一碟！识别效果如下图所示：

整堆炸鸡块被识别成一个整体

每一块炸鸡块被单独识别

据研究者透露，之前尝试过其他的机器学习框架，但看到有人利用TensorFlow成功对猫的照片进行分类后，就按捺不住内心的躁动了。

光想不做可不行，紧接着，研究团队对CNN的相关论文进行了阅读和学习，并进行了进一步的物体检测。

那时正好是初代Foodly发布初期，在对系统前期表现相当满意的情况下，研究者们拿出究极武器——炸鸡，可以看到，初代系统能够将图像的一部分切成矩形，然后以矩形为单位对炸鸡块进行识别。

虽然初代系统的表现就已经很不错了，但是研究团队表示还存在很多不足，比如识别时间太慢，识别一块炸鸡要一分钟左右，一分钟炸鸡骨头都被吸干了还识别个啥！再比如，初代系统还只能识别单块炸鸡，成堆的炸鸡识别还有待进一步地改进。

同时，为了养活这么一个系统，可真是“难哭”了研究团队，那个时期他们在公司现炸鸡块，炸累了点炸鸡外卖，简直就是把公司当成了炸鸡加盟店！

当然这都不是最难的，最难的是要在下嘴之前先把图像数据存储下来。这么下来，他们最终收集到了大概400~500张规范的炸鸡照片，700多张不那么规范的照片。

在那些不规范的照片中，有一些还故意拍到了人手，这也是有研究考量的。因为人手和炸鸡成色很像，形状也像，如果系统错误地对人手进行识别的话那可就大事不妙了。

Foodly进化史：从R-CNN起家，炸鸡块表面的凹凸纹路也不能放过

可以想见，开发Foodly可不是这么简单的事。

其实Foodly的前身还不叫Foodly，而是NEKONOTE，由一个扶手和安装在顶部的照相机组成，虽然看上去像是工业用机器人的形状，但是即使加上照相机用的框架，大小也能控制在一个人的样子。

2016年6月，NEKONOTE在“TensorFlow学习会”上发表，在德国CEBIT 2017上公开亮相。出道舞台虽然足够有分量，但还是出师不利，当场就有不少人对NEKONOTE提出质疑，有人认为NEKONOTE只使用一只手，太可怕了，有人认为在食材正上方放置摄像头，可能会污染食物，还有人针对NEKONOTE的照相机和手臂的位置关系，指出手臂的摆动可能会影响到视线和识别效果。

CEBIT 2017上展出的NEKONOTE

综合了这些提议之后，研究者认为，或许应该把它设计成人型，于是NEKONOTE就摇身一变，变成了现在的Foodly。

当然这个过程可不只是外观的变化，升级归来的Foodly不仅能识别单块炸鸡，还能从堆积的炸鸡中检测出每一块炸鸡。

识别效果的提高也是多方面促成的，首先识别标准从矩形识别变成了轮廓识别，这其中主要用到的就是从R-CNN发展而来的Mask R-CNN技术，其次，Foodly使用了可以识别炸鸡纹路的深度摄像机，炸鸡块表面的凹凸纹路也作为特征被引入了深度学习，提高了识别精度。

根据深度摄像机提供的影像学习凹凸特征

几代系统迭代发展下来，研究者总结了用TensorFlow进行炸鸡识别的心得，汇总成了下面这张从理论学习到推论的流程图：

首先是制作监督数据集的阶段。用位于Foodly头部的深浅相机拍摄颜色和深浅的图像(RGB-D图像)，然后将其放入个人电脑进行标注，指定炸鸡块的位置。在标注上，团队也制作了专门的工具使其尽可能的自动化。

在接下来的学习阶段，以既有的公开训练成果模型为基础，通过TensorFlow进行转移学习，制作食材检测用的模型。转移学习的引入也让几百张的图像工作量锐减到了几十张。

但是，既有的训练成果的模型只能输入RGB的3个通道，为了能够对应RGB-D图像，需要将输入层变更为4个通道才能进行再学习。

最后，把做好的模型转移到机器人上，就可以检测出炸鸡块。在搭载压缩GPU的边缘的AI板Jetson TX2上执行推理过程。

顺便一提，Foodly的目标是可以直接拿到便当工厂的生产线上使用。因此，根据工厂的不同，照明的程度也不同，增加了识别的难度。常见的对策通常是准备专用的光源，不过，Foodly在训练阶段就适用了多样的光度，因此即使没有专用的光源也能能稳定的进行识别。

以上就是关于识别炸鸡块的整个流程，以实用的速度检测炸鸡块，然后将其放入便当盒的操作现在已经很稳定了。公司现在也把目光对准了其他的食物，比如番茄，相比于炸鸡，要让机器人把番茄放入便当盒而不让其碎掉，还必须调整机器人的力度，这就是另一个需要解决的问题了。

RT公司：机器人是未来社会的引路者

可别再说Foodly是日本人民的脑洞发明了。

Foodly可是瞄准了当下便当工厂人手不足的现状，尤其是疫情之下，为了降低感染风险，Foodly可以代替人加入生产线，而且，表现不比人差。

考虑到大多数便当工厂的工作场所都是在60~90cm的空间内，目前工业机器人还有几方面问题需要重点考虑：硬件上希望即使有人不可避免地碰撞到Foodly也不造成擦伤，软件上，即使在没有预设的情况下，也能正常识别，除此之外，便当工厂流水线的菜单每小时会改变2~3次，便当盒尺寸存在差异，流动速度也有不同等等。

这些不确定因素在Foodly面前全都迎刃而解，而且，Foodly操作也十分简单，不需要专家进行任何复杂的安装和调整，马上就能上工，可以说是工厂福音了。

好奇之下，文摘菌还去查了查开发Foodly的公司到底是什么来头，结果发现，这家叫做RT CORPORATION的公司完全就是一个机器人迷公司嘛！

先不说公司的理念是“life with robot”，公司名字RT是Robot Technology的缩写，公司的兔子logo来源参考了《爱丽丝梦游仙境》，官网介绍道，在小说中，兔子是爱丽丝抵达仙境的引路人，与此相对应的，在现实中，机器人就是未来生活的引导者。

除了实用机器人如Foodly的开发，RT公司也对机器人工程的教育事业十分关注。

公司认为，在现在和未来，培养优秀的机器人工程师都将是重要的社会使命。RT公司从硬件和软件等多个角度提供产品和服务，为培养实用型机器人工程师做足了功课。

作为教育工作的一部分，公司将提供自主研发装配的机器人用于学习和参考，同时，在这些机器人的帮助下，公司有能力举办研讨会等学习活动，为更多的人提供学习机会。

如今，机器人在社会生活中扮演着越来越重要的角色，工厂流水线上运行的大型工业机器人不断发展，家用小型机器人同样不断演变着，机器人已经到了能够与人合作、并肩作战的阶段。

相信机器人引领我们前往的未来不会太遥远。

【云栖号在线课堂】每天都有产品技术专家分享！
课程地址：https://yqh.aliyun.com/zhibo

立即加入社群，与专家面对面，及时了解课程最新动态！
【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间：2020-04-20
本文作者：李欣月、刘俊寰
本文来自：“大数据文摘公众号”，了解相关信息可以关注“大数据文摘”

微信关注我们

原文链接：https://yq.aliyun.com/articles/756507

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2020-04-21 15:28:00

爬虫管理平台 Crawlab v0.4.10 发布

前言本次更新包括几个部分：日志集中管理自动安装依赖开放 API Web Hook 自动生成结果集更新日志功能 / 优化优化日志管理. 集中化管理日志，储存在 MongoDB，减少对 PubSub 的依赖，允许日志异常检测. 自动安装依赖. 允许从requirements.txt和package.json自动安装依赖. API Token. 允许用户生成 API Token，并利用它们来集成到自己的系统中. Web Hook. 当任务开始或结束时，触发 Web Hook http 请求到预定义好的 URL. 自动生成结果集. 如果没有设置，自动设置结果集为results_<spider_name>. 优化项目列表. 项目列表中不展示 "No Project". 升级 Node.js. 将 Node.js 版本从 v8.12 升级到 v10.19. 定时任务增加运行按钮. 允许用户在定时任务界面手动运行爬虫任务. Bug 修复无法注册.#670 爬虫定时任务标签 Cron 表达式显示秒.#678 爬虫每日数据缺失.#684 结果数量未即时更新.#689 产品规划...

658

2020-04-21 00:00:00

【云栖号案例 | 教育与科研机构】掌门1对1上云你的专属老师在线上等你教育没有疫情

云栖号案例库：【点击查看更多上云案例】不知道怎么上云？看云栖号案例库，了解不同行业不同发展阶段的上云方案，助力你上云决策！随着全国各地教育主管部门相继推出教育防疫方案，如何帮助孩子实现在家上课成为当务之急。 1月27日，掌门教育面向湖北地区中小学生捐赠价值2000万元1对1直播课程，帮助当地孩子们顺利实现“云”学习，并承诺将全面保证疫情期间的教学和服务品质，携手社会各界共同打赢这场看不到硝烟的战争。全国线上课堂上线之后，从传统线下教学直接搬到线上的挑战逐渐显露出来，比如网络卡顿、基础资源不足造成的系统性宕机、无法直接互动反馈、无法保证教学质量等等…… 而中国商业化线上教育在过去的两年刚刚经历过的风口，催生了一整套完整的技术解决方案，具有很大的借鉴价值。以在K12在线1对1全科辅导领域用户份额近八成的掌门1对1（掌门教育旗下知名品牌）为例，其拥有超过10000名教研员，服务遍布全国 600 多个省市县，让一线城市优质教育资源共享到更多偏远地区和贫困地区。掌门1对1在6年的发展过程中，是如何应对IT基础资源、网络速度、师生互动、因材施教等线上教育挑战，从而让在线教育回归平等普惠和个...

592

资源下载

更多资源

Mario，低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。