开源大数据周刊-第19期-低调大师

开源大数据周刊-第19期

2016-08-21 610 89

阿里云E-Mapreduce动态

E-Mapreduce团队

1.5.0版本（正在研发）

增加集群整体运行情况的仪表盘
访问OSS不需要写id、key，增强安全性
集群其中后，可以重启、修改配置及安装软件

1.6.0版本

交互式查询（支持hive、spark）

资讯

马云：云计算、大数据、人工智能未来三十年会成基本公共服务
未来三十年，云计算、大数据、人工智能，都会成为基本的公共服务，各行各业都会经受巨大的变化。”阿里巴巴董事局主席马云18日出席2016中国保险业发展年会时表示，“物流业、制造业、服务业、金融业、教育，所有的行业，在这场技术革命之下改变是不可避免的。”
E-MapReduce支持计算与存储分离,成本下降1倍
众观历史，分久必合、合久必分，在计算机历史中也很类似，如今，Hadoop也许到了计算与存储分离的阶段。
13个应用案例，讲述最真实的

微信关注我们

原文链接：https://yq.aliyun.com/articles/59313

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2016-08-21 00:00:00

Spark——分布式并行计算概念

一，概念一个资源密集型的任务，需要一组资源并行的完成，当计算机任务过重，就把计算任务拆分，然后放到多个计算节点上同时执行，这就是分布式并行计算啦。分布式并行计算，强调用硬件的堆叠，来解决问题。 spark解决的问题：有了spark,只要把数据和程序交给spark,它会机智地进行数据切分、算法复制、分布执行、结果合并。spark屏蔽了分布并行计算的细节，让我们可以快速开发分布并行的应用。二，基于数据集的计算框架 spark的计算范式是数据集上的计算，在实用spark的时候，要按照spark的范式写算法。Spark在数据集的层次上进行分布并行计算，它只认成堆的数据。提交给spark的任务，都必须满足两个条件：数据是可以分块的，每块构成一个集合。算法只能在集合级别执行操作。比如，对于文本文件，在Spark中，一行就是一条记录，若干条记录组成一个集合。我们原来的算法直接在每一行上进行计算，就不行了。需要先构建数据集，然后通过数据集的操作，实现我们的目的。所以，Spark是一种粗粒度、基于数据集的并行计算框架。三，Spark基本概念及拆分任务的流程 1...

653

2016-08-22 00:00:00

hive数据迁移

比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hiverc vi ~/.hiverc use test; 创建数据临时目录 hdfs dfs -mkdir /tmp/test 生成导出数据脚本 hive -e "show tables " | awk '{printf "export table %s to |/tmp/hive-export/%s|;\n",$1,$1}' | sed "s/|/'/g" > /home/hive/qcf/export.hql 手工导出数据到hdfs hive -f export.hql - 下载hdfs数据到本地并传送到目标hadoop集群的/tmp/ test 目录先get到本地： hdfs dfs -get /tmp/ test /* 然后put到目标集群上 hdfs dfs -put * /tmp/test 构造导入语句 cp export....

573

资源下载

更多资源

Mario，低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。