2013年北京hadoop in china见闻
谈下这次参加中国hadoop技术峰会的收获,两天大约听了20场次,上午的是必听的,下午就听了一些关心。大数据峰会肯定是包括技术和技术之上的应用的。各个公司结合自己的业务特点来构建集群,特别听到了电信和银行类的公司在用hadoop或者尝试去用。应用的情况简单的出出报表,复杂点可能会涉及到一些机器学习和深度挖掘。
非技术的来看,本次大会传递的信息有:
- 银行、电信也在用hadoop
- hadoop生态圈依然是大数据相关技术的首选
- 国内很多大小公司正在使用hadoop
- 因为开源,所以繁荣
技术来看,本次大会传递的信息有:
- YARN将是下一代hadoop平台,多种计算模型即将随YARN一起整合资源。
- 硬件结合hadoop来提升性能。
- 可以尝试在虚拟机上做YARN,如EMR。
- 准实时的时代即将到来,也可以说spark等基于内存的分布式时代即将到来。
数据的收集、交换