专访阿里王峰:Hadoop生态下一代计算引擎-streaming和batch的统一
编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况。本次InfoQ便采访了阿里搜索离线基础平台团队负责人王峰,和大家一起聊一聊Hadoop。
问:您是2009年开始关注Hadoop生态技术发展,并逐步将其引入阿里电商搜索技术体系。那时的Hadoop生态圈是怎样的?可否介绍下Hadoop在阿里的历史?
王峰:对于Hadoop,我个人很早就了解了。Hadoop 06年出来,我们07在雅虎中国见到用Hadoop做search,搜索引擎是大数据的第一个应用场景。当时和雅虎美国合