开源大数据周刊-第16期
阿里云E-Mapreduce动态
1.4版本(已经发布)
- 作业运行失败报警
- 作业并行提交
- 添加sqoop、shell类型的作业
1.4.1版本(正在研发)
- 完善失败报警
- 完善定时任务,增加小时、分钟定时任务
1.5.0版本 (正在研发)
- 集群整体运行情况的仪表盘
- 集群状态监控报警
1.6.0版本
- 交互式查询(支持hive、spark)
资讯
Apache Spark 2.0.0 发布,APIs 更新
该版本主要更新APIs,支持SQL 2003,支持R UDF ,增强其性能。
spark2.0技术预览,更易用、更快速、更智能
spark2.0统一了streaming与batch的api,引入了dataset,另外就是tungsten等性能优化,让spark成为更加优秀的分布式计算引擎。