2013年北京hadoop in china见闻
谈下这次参加中国hadoop技术峰会的收获,两天大约听了20场次,上午的是必听的,下午就听了一些关心。大数据峰会肯定是包括技术和技术之上的应用的。各个公司结合自己的业务特点来构建集群,特别听到了电信和银行类的公司在用hadoop或者尝试去用。应用的情况简单的出出报表,复杂点可能会涉及到一些机器学习和深度挖掘。 非技术的来看,本次大会传递的信息有: 银行、电信也在用hadoop hadoop生态圈依然是大数据相关技术的首选 国内很多大小公司正在使用hadoop 因为开源,所以繁荣 技术来看,本次大会传递的信息有: YARN将是下一代hadoop平台,多种计算模型即将随YARN一起整合资源。 硬件结合hadoop来提升性能。 可以尝试在虚拟机上做YARN,如EMR。 准实时的时代即将到来,也可以说spark等基于内存的分布式时代即将到来。数据的收集、交换