Hadoop是怎么分块Block的？-低调大师

Hadoop是怎么分块Block的？

2016-12-31 671

hadoop的分块有两部分。

　　第一部分就是数据的划分（即把File划分成Block），这个是物理上真真实实的进行了划分，数据文件上传到HDFS里的时候，需要划分成一块一块，每块的大小由hadoop-default.xml里配置选项进行划分。

<property>  
  <name>dfs.block.size</name>  
  <value>67108864</value>  
  <description>The default block size for new files.</description>  
</property>

　　这个就是默认的每个块64MB。数据划分的时候有冗余，个数是由以下配置指定的。

<property>  
  <name>dfs.replication</name>  
  <value>3</value>  
  <description>Default block replication.   
  The actual number of replications can be specified when the file is created.  
  The default is used if replication is not specified in create time.  
  </description>  
</property>

　　具体的物理划分步骤由Namenode决定。

　　第二种划分是由InputFormat这个接口来定义的，其中有个getSplits方法。这里有一个新的概念：fileSplit。每个map处理一个fileSplit，所以有多少个fileSplit就有多少个map（map数并不是单纯的由用户设置决定的）。
　　我们来看一下hadoop分配splits的源码：

   
  
if ((length != 0) && isSplitable(fs, path)) {  
    long blockSize = file.getBlockSize();  
    long splitSize = computeSplitSize(goalSize, minSize, blockSize);  
    long bytesRemaining = length;  
      
    while (((double) bytesRemaining)/splitSize > SPLIT_SLOP) {  
        int blkIndex = getBlockIndex(blkLocations, length-bytesRemaining);  
        splits.add(new FileSplit(path, length-bytesRemaining, splitSize, blkLocations[blkIndex].getHosts()));  
        bytesRemaining -= splitSize;          
    }  
      
    if (bytesRemaining != 0) {  
      
    splits.add(new FileSplit(path, length-bytesRemaining, bytesRemaining,  blkLocations[blkLocations.length-1].getHosts()));        }  
  
} else if(length!=0) {  
  
    splits.add(new FileSplit(path,0,length,blkLocations[0].getHosts()));  
  
}else{  
  
    // Create empty hosts array for zero length files  
      
    splits.add(new FileSplit(path,0,length,new String[0]));  
}  
   
  
　　从代码可以看出，一个块为一个splits，即一个map，只要搞清楚一个块的大小，就能计算出运行时的map数。而一个split的大小是由goalSize, minSize, blockSize这三个值决定的。computeSplitSize的逻辑是，先从goalSize和blockSize两个值中选出最小的那个（比如一般不设置map数，这时blockSize为当前文件的块size，而goalSize是文件大小除以用户设置的map数得到的，如果没设置的话，默认是1），在默认的大多数情况下，blockSize比较小。然后再取bloceSize和minSize中最大的那个。而minSize如果不通过”mapred.min.split.size”设置的话（”mapred.min.split.size”默认为0），minSize为1，这样得出的一个splits的size就是blockSize，即一个块一个map，有多少块就有多少map。
　　上面说的是splitable的情况，unsplitable可以根据实际情况来计算，一般为一个文件一个map。

　　下面是摘自网上的一个总结：

　　几个简单的结论：
1、一个split不会包含零点几或者几点几个Block，一定是包含大于等于1个整数个Block。
　　　　2、一个split不会包含两个File的Block,不会跨越File边界。
　　　　3、split和Block的关系是一对多的关系。
　　　　4、maptasks的个数最终决定于splits的长度。

　　还有一点需要说明，在FileSplit类中，有一项是private String[] hosts；
看上去是说明这个FileSplit是放在哪些机器上的，实际上hosts里只是存储了一个Block的冗余机器列表。
比如有个fileSplit 有4个block: Block11, Block12, Block13,Block14,这个FileSplit中的hosts里最终存储的是Block11本身和其备份所在的机器列表，也就是说 Block12,Block13,Block14存在哪些机器上没有在FileSplit中记录。

　　FileSplit中的这个属性有利于调度作业时候的数据本地性问题。如果一个tasktracker前来索取task，jobtracker就会找个 task给他，找到一个maptask，得先看这个task的输入的FileSplit里hosts是否包含tasktracker所在机器，也就是判断和该tasktracker同时存在一个机器上的datanode是否拥有FileSplit中某个Block的备份。

　　但总之，只能牵就一个Block，其他Block就要从网络上传。不过对于默认大多数情况下的一个block对应一个map，可以通过修改hosts使map的本地化数更多一些。在讲block的hosts传给fileSplit时，hosts中的主机地址可以有多个，表示map可以从优先从这些hosts中选取（只是优先，但hdfs还很可能根据当时的网络负载选择不是hosts中的主机起map task）。

　　知道这个特性之后，可以修改传回给fileSplit的hosts，在列表中只写block所在的那些hosts，这样hdfs就会优先将这些map放到这些hosts上去执行，由于hosts上有该block，就省掉了网络传输数据的时间。

　　这样做的话，在job很多的时候，可能会出现hot spot，即数据用的越多，它所在hosts上的map task就会越多。所以在考虑修改传给fileSplit的时候要考虑平衡诸多因素。

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/7647089.html，如需转载请自行联系原作者

微信关注我们

原文链接：https://yq.aliyun.com/articles/363408

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

ITTC数据挖掘平台介绍（综述）——平台简介

数据挖掘方兴未艾，大量新事物层出不穷。本系列将介绍我们自主设计的数据挖掘软件平台。与大家共同分享对知识，微博，人际等复杂网络的分析，以及对自然语言处理的见解。一、我们需要怎样的数据挖掘系统一直以来，以高校为代表的学术界和以公司为代表的商业界，都有很大的隔阂。学术界普遍不会做产品，商业界普遍不会搞研究。如果两者都强，那就是美国军方了。在数据挖掘领域更是如此，大量关于复杂网络，自然语言处理的牛文层出不穷，却被研究机构和大公司养在深闺人未识。绝大多数智能机器学习算法被封装在基础层中，以潜移默化的方式服务用户（比如用户推荐等），普通用户无法将其用于自己的应用场景。而以SPSS为代表的统计和商业智能为核心的平台，使用复杂，结构封闭，它们以统计为核心，但在真正的“智能”领域，依旧缺乏火候。因此，我们需要能面向普通用户的易用系统，甚至不需要写脚本。说到数据挖掘，就一定要和“大数据”放在一起。可是，几百万条的数据，根本不算是大数据，一台笔记本都能在数小时内处理完成，更不需要用复杂的分布式引擎去完成（可能为了实现这套算法，开发时间就比使用时间都长）。而真正的应用场景，数据越大，反而越不值钱...

2016-12-31

779

Kudu目前具有以下优点 OLAP 工作的快速处理；与 MapReduce，Spark 和其他 Hadoop 生态系统组件集成；与 Apache Impala（incubating）紧密集成，使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案；强大而灵活的一致性模型，允许您根据每个 per-request（请求选择）一致性要求，包括 strict-- serializable（严格可序列化）一致性的选项；针对同时运行顺序和随机工作负载的情况性能很好；使用 Cloudera Manager 轻松维护和管理； High availability（高可用性）。Tablet server 和 Master 使用 Raft Consensus Algorithm 来保证节点的 -- 高可用，确保只要有一半以上的副本可用，该 tablet 便可用于读写。例如，如果 3 个副本中有 2 个或 5 个副本中的 3 个可用，则该 tablet 可用。即使在 leader tablet 出现故障的情况下，读取功能也可以通过 read-only（只读的）foll...

2016-12-31

854

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。