搜索[hadoop]结果-低调大师优秀个人博客

精选列表

搜索[hadoop]，共8443篇文章

Hadoop集群（第7期）_Eclipse开发环境设置

1、Hadoop开发环境简介 1.1 Hadoop集群简介 Java版本：jdk-6u31-linux-i586.bin Linux系统：CentOS6.0 Hadoop版本：hadoop-

2017-12-30

Hadoop集群（第2期）_机器信息分布表

hadoop（全小写）一般用户名称（Name） hadoop（全小写）一般用户密码（PWD） hadoop（全小写） 2.2 Slave1服务器名称详细信息机器名称 Slave1.Hadoop

2017-12-30

Hadoop MapReduce工作详细流程（Partitioner/SortComparator/GroupingComparator）

转自：http://blog.sina.com.cn/s/blog_7581a4c30102veem.html map阶段 1. 使用job.setInputFormatClass(TextInputFormat)做为输入格式。注意输出应该符合自定义Map中定义的输出。 2. 进入Mapper的map()方法，生成一个List。 3. 在map阶段的最后，会先调用job.setPartitionerClass()对这个List进行分区，每个分区映射到一个reducer。 4. 每个分区内又调用job.setSortComparatorClass()设置的key比较函数类排序(如果没有通过job.setSortComparatorClass()设置key比较函数类，则使用key的实现的compareTo方法)。可以看到，这是一个二次排序。 5. 如果设置了Combiner（job.setCombinerClass）对output进行一次合并，从而减少对reduce的输出流量和预处理reduce的input数据。但不一定会执行，对于Combiner执行时机参考Reference[4]。【说明】以上步骤省略了collect阶段、cache阶段等细节，更详细步骤参考Reference[3] reduce阶段 1. shuffle阶段 reducer开始fetch所有映射到这个reducer的map输出。 2.1 sort阶段再次调用job.setSortComparatorClass()设置的key比较函数类对所有数据对排序(因为一个reducer接受多个mappers，需要重新排序)。 2.2 secondary sort阶段然后开始构造一个key对应的value迭代器。这时就要用到分组，使用jobjob.setGroupingComparatorClass()设置的分组函数类。只要这个比较器比较的两个key相同，他们就属于同一个组，它们的value放在一个value迭代器，而这个迭代器的key使用属于同一个组的所有key的第一个key。 3.reduce阶段最后就是进入Reducer的reduce()方法，reduce()方法的输入是所有的（key和它的value迭代器）。同样注意输入与输出的类型必须与自定义的Reducer中声明的一致。【注意】reducers的输出是无序的。

2017-12-24

单机安装 CentOS 5 + hadoop-0.20.0

这种安装方式仅仅适用于做实验，快速搭建Hadoop环境，不适合生产环境。

2017-12-20

[Hadoop大数据]——Hive连接JOIN用例详解

/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in [jar:file:/usr/hadoop/hadoop-2.6.4/

2017-12-03

hadoop+hive使用中遇到的问题汇总

问题排查方式一般的错误，查看错误输出，按照关键字google 异常错误（如namenode、datanode莫名其妙挂了）：查看hadoop（$HADOOP_HOME/logs）或hive日志 hadoop

2017-11-28

CentOS 7 快速架设hadoop 2.5.1集群

主机用户2: hadoop 密码 hadoop c.JDK位置： /usr/local 即/usr/local/jdk1.7.0_71 d.hadoop 位置: /opt 即/opt/hadoop-

2017-11-26

运行Hadoop自带的wordcount单词统计程序

] #pwd /usr/local/hadoop/share/hadoop/mapreduce [root@leafmapreduce] #ls hadoop-mapreduce-client-app-

2017-11-25

Centos6.4 +Hadoop 1.2.1集群配置

Hadoop 1.2.1版本下载地址：http://apache.dataguru.cn/hadoop/common/hadoop-1.2.1/ 本文章配置的是完全分布模式。

2017-11-21

小白学习大数据测试之hadoop初探

Hadoop的历史这里就不多说了，网上很多资料，总而言之对于hadoop谷歌和雅虎对于ta的贡献功不可没。

2017-11-21

Hadoop项目之Cloudera 5.6.0.1（CDH）的安装部署

1 前言 Cloudera是基于Apache原生的Hadoop组件进行重新封装和加强，Cloudera可以简化Hadoop组件的部署。

2017-11-21

hadoop 测试第一个mapreduce程序

说明：测试hadoop自带的实例 wordcount程序（此程序统计每个单词在文件中出现的次数） 2.6.0版本jar程序的路径是 /usr/local/hadoop-2.6.0/share/hadoop

2017-11-21

CDH5.4.7安装Hadoop集群检查主机报错

应用场景在用CDH5.4.7搭建Hadoop集群的时候，难免遇到一些错误，比如在检查主机的时候遇到各种报错等等。

2017-11-20

CDH5.4.7安装Hadoop集群安装主机失败

应用场景在用CDH5.4.7搭建Hadoop集群的时候，难免遇到一些错误，比如在检查主机的时候遇到各种报错等等。

2017-11-20

Hadoop项目实战－用户行为分析之编码实践

下面我们来看看本课程有哪些课时，如下图所示：首先，我们来学习第一课时：《Hadoop项目基础代码》。

2017-11-19

Hadoop2源码分析－序列化篇

这些缺点对于Hadoop来说是不合适的，导致Hadoop没有采用Java自身的序列化机制，而是Hadoop自己开发了一套适合自己的序列化机制。

2017-11-19

Hadoop2源码分析－HDFS核心模块分析

1.概述这篇博客接着《Hadoop2源码分析－RPC机制初识》来讲述，前面我们对MapReduce、序列化、RPC进行了分析和探索，对Hadoop V2的这些模块都有了大致的了解，通过对这些模块的研究

2017-11-19

CDH5.4.7安装分布式Hadoop集群

应用场景部署Hadoop集群过程中，可以使用开源的Apache Hadoop或者可以用CDH【国外的一家公司基于开源的封装的】，搭建更加方便，方便扩充节点规模，组件管控，性能监控等等，但是也有一个弊端

2017-11-19

hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker介绍

此外，Hadoop提供的分布式文件系统（HDFS）主要负责各个节点的数据存储，并实现了高吞吐率的数据读写。在分布式存储和分布式计算方面，Hadoop都是用从/从（Master/Slave）架构。

2017-11-16

hadoop完全分布式集群下安装sqoop

应用场景当我们按照hadoop完全分布式集群搭建博客搭建了hadoop以后，发现这是一个空的hadoop，只有YARN，MapReduce，HDFS，而这些实际上我们一般不会直接使用，而是需要另外部署

2017-11-14

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

精选列表

Hadoop集群（第7期）_Eclipse开发环境设置

Hadoop集群（第2期）_机器信息分布表

Hadoop MapReduce工作详细流程（Partitioner/SortComparator/GroupingComparator）

单机安装 CentOS 5 + hadoop-0.20.0

[Hadoop大数据]——Hive连接JOIN用例详解

hadoop+hive使用中遇到的问题汇总

CentOS 7 快速架设hadoop 2.5.1集群

运行Hadoop自带的wordcount单词统计程序

Centos6.4 +Hadoop 1.2.1集群配置

小白学习大数据测试之hadoop初探

Hadoop项目之Cloudera 5.6.0.1（CDH）的安装部署

hadoop 测试第一个mapreduce程序

CDH5.4.7安装Hadoop集群检查主机报错

CDH5.4.7安装Hadoop集群安装主机失败

Hadoop项目实战－用户行为分析之编码实践

Hadoop2源码分析－序列化篇

Hadoop2源码分析－HDFS核心模块分析

CDH5.4.7安装分布式Hadoop集群

hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker介绍

hadoop完全分布式集群下安装sqoop

资源下载

Mario

腾讯云软件源

Nacos

Sublime Text

欢迎您来访！