2013年北京hadoop in china见闻-低调大师

2013年北京hadoop in china见闻

2016-04-19 791

谈下这次参加中国hadoop技术峰会的收获，两天大约听了20场次，上午的是必听的，下午就听了一些关心。大数据峰会肯定是包括技术和技术之上的应用的。各个公司结合自己的业务特点来构建集群，特别听到了电信和银行类的公司在用hadoop或者尝试去用。应用的情况简单的出出报表，复杂点可能会涉及到一些机器学习和深度挖掘。

非技术的来看，本次大会传递的信息有：

银行、电信也在用hadoop
hadoop生态圈依然是大数据相关技术的首选
国内很多大小公司正在使用hadoop
因为开源，所以繁荣

技术来看，本次大会传递的信息有：

YARN将是下一代hadoop平台，多种计算模型即将随YARN一起整合资源。
硬件结合hadoop来提升性能。
可以尝试在虚拟机上做YARN，如EMR。
准实时的时代即将到来，也可以说spark等基于内存的分布式时代即将到来。
数据的收集、交换

微信关注我们

原文链接：https://yq.aliyun.com/articles/31227

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hadoop2.6.0版本MapReudce示例之WordCount（二）

继《Hadoop2.6.0版本MapReudce示例之WordCount（一）》之后，我们继续看MapReduce的WordCount示例，看看如何监控作业运行或查看历史记录，以及作业运行时的文件目录及列表。 1、监控作业运行或查看历史记录在WordCount的输出内容中，有这么一句：The url to track the job: http://server2:8088/proxy/application_1459913635503_0004/，这个是追踪作业运行的意思，登录后，可以查看Job整体情况、配置信息Configuration、Map Tasks情况、Reduce Tasks情况、Job计数器Counters、作业历史JobHistory等情况，分别如下图所示： 1.1、Job整体情况 Job整体情况包括作业名、提交用户名、作业队列、作业状态、提交时间、开始时间、完成时间、耗时、平均Map耗时、平均Shuffle耗时、平均合并耗时、平均聚合耗时、Map、Reduce任务各自总数及完成数、Map、Reduce任务尝试运行各自总数、失败数、杀死...

2016-04-18

741

过程今天过来参加《china hadoop summit》，听了不少的场次。从技术栈上分类，大致为了硬件、linux等基础软件、hadoop生态圈、分析与应用。我目前主要关注底层的软件技术，主要听了sql on hadoop及hadoop系统架构两个分会场的一些内容。下面讲述下我听的一些场次：上午场次：孙先生讲的《Towards consistent distributed system》，给我们带来了从CAP理论出发，以新的视角去看待分布式系统，怎么权衡去设计分布式软件系统。 cloudera中国区的CTO，苗先生的《hadoop and cloudera》讲述了公司的发展，08年成立，目前1000人左右，54%的hadoop Committer，hadoop从批处理往实时化方向发展，基本听下来就是公司对hadoop有很大的控

2016-04-19

919

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。