《Hadoop技术详解》一2.4　读写数据-低调大师

《Hadoop技术详解》一2.4　读写数据

2017-05-01 618

本节书摘来异步社区《Hadoop技术详解》一书中的第2章，第2.4节，作者：【美】Eric Sammer 译者：刘敏 , 麦耀锋 , 李冀蕾 , 等，更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.4　读写数据

客户端可以通过多种不同的工具和应用程序接口（参见2.8节“访问与集成”）对HDFS进行读写操作，这些操作都遵循着同样的流程。在某些层面，客户端可能要使用到Hadoop库函数，因为只有Hadoop库函数才清楚知道HDFS的具体细节和相关语法。函数库封装了大部分与NameNode 和DataNode通信相关的细节，同时也考虑了分布式文件系统在诸多场景中的错误处理机制。

2.4.1　数据读取流程

首先，我们来看一下HDFS数据读取操作的处理逻辑。假设，HDFS中已经存储了一个文件/user/esammer/foo.txt，要读取文件，Hadoop客户端程序库（通常是Java的JAR文件）是必不可少的。同时，客户端还必须有集群配置数据的副本，因为它包含了NameNode的位置信息（参见第5章）。如图2-2所示，客户端首先要访问NameNode，并告诉它所要读取的文件，当然，这之前必须对客户的身份进行确认。客户身份确认有两种方式：一种是通过信任的客户端，由其指定用户名；第二种方式是通过诸如Kerberos（参见第6章）等强认证机制来完成。接下来还必须检查文件的所有者及其设定的访问权限。如果文件确实存在，而且用户对这个文件有访问权限，这时NameNode就会告诉客户端这个文件的第一个数据块的标号以及保存有该数据块的DataNode列表。这个列表是根据DataNode与客户端间的距离进行了排序的。客户端与DataNode之间的距离是根据Hadoop集群的机架拓扑结构计算得到的。机架拓扑结构记录了主机机架位置的配置信息（有关机架拓扑配置的更多详情，请参见第5.9节“机架拓扑”）。

在NameNode因为自身原因或网络故障无法访问时，客户端会收到超时或异常出错消息，数据读取操作也就无法继续。

有了数据块标号和DataNode的主机名，客户端便可以直接访问最合适的DataNode，读取所需要的数据块。这个过程会一直重复直到该文件的所有数据块读取完成或客户端主动关闭了文件流。

从DataNode读取数据时，可能会发生进程或主机异常结束的情况。这时，数据读操作不会停止，HDFS 程序库会自动尝试从其他有数据副本的DataNode中读取数据。如果所有数据副本都无法访问，则读取操作失败，客户端收到异常出错消息。还有一种情况，当客户端试图从DataNode中读取数据时，NameNode返回的数据块位置信息已经过期。这时如果还有其他DataNode保存有该数据块副本，客户端会尝试从那些DataNode中读取数据，否则至此读取操作就会失败。这些情况很少发生，但对Hadoop这样的大规模分布式系统而言，一旦发生，调查分析过程就会异常复杂。第9章将介绍什么情况可能导致出错以及如何诊断这类问题。

2.4.2　数据写操作流程

HDFS写数据操作比读取数据操作要相对复杂些。我们先来看个最简单的例子：客户端要在集群中创建一个新文件，当然客户端并不一定要真正实现这里介绍的逻辑，在这里只是作为一个例子来介绍Hadoop库函数是如何将数据写入到集群中的。其实应用程序开发人员可以像操作传统的本地文件一样，用他们熟悉的应用程序接口（API）打开文件、写入流，然后关闭流即可。

首先，客户端通过Hadoop文件系统相关API发送请求打开一个要写入的文件，如果该用户有足够的访问权限，这一请求就会被送到NameNode，并在NameNode上建立该文件的元数据。刚建立的新文件元数据并未将该文件和任何数据块关联，这时客户端会收到“打开文件成功”的响应，然后就可以开始写入数据了。当然在API层面会返回一个标准的Java流对象，这一实现只是针对HDFS的。当客户端将数据写入流时，数据会被自动拆分成数据包（这里，不要和TCP数据包或HDFS数据块混淆），并将数据包保存在内存队列中。客户端有一个独立的线程，它从队列中读取数据包，并同时向NameNode请求一组DataNode列表，以便写入下一个数据块的多个副本。接着，客户端直接连接到列表中的第一个DataNode，而该DataNode又连接到第二个DataNode，第二个又连接到第三个上……这样就建立了数据块的复制管道，如图2-3所示。数据包以流的方式写入第一个DataNode的磁盘，同时传入管道中的下一个DataNode并写入其磁盘，依此类推。复制管道中的每一个DataNode都会确认所收数据包已经成功写入磁盘。客户端应用程序维护着一个列表，记录哪些数据包尚未收到确认消息。每收到一个响应，客户端便知道数据已经成功地写入到管道中的一个DataNode。当数据块被写满时，客户端将重新向NameNode申请下一组DataNodes。最终，客户端将剩余数据包全部写入磁盘，关闭数据流并通知NameNode文件写操作已经完成。

然而，凡事绝非如此简单，出现问题在所难免。最常见的情况是，复制管道中的某一DataNode无法将数据写入磁盘（磁盘翘了辫子或DataNode死机）。发生这种错误时，管道会立即关闭，已发送的但尚未收到确认的数据包会被退回到队列中，以确保管道中错误节点的下游节点可以获得数据包。而在剩下的健康数据节点中，正在写入的数据块会被分配新的ID。这样，当发生故障的数据节点恢复后，冗余的数据块就好像不属于任何文件而被自动丢弃，由剩余数据节点组成的新复制管道会重新开放，写入操作得以继续。此时，雨过天晴，写操作将继续直至文件关闭。NameNode如果发现文件的某个数据块正在复制，就会异步地创建一个新的复制块，这样，即便集群的多个数据节点发生错误，客户端仍然可以从数据块的副本中恢复数据，前提是满足要求的最少数目的数据副本已经被正确写入（默认的最少数据副本是1）。

微信关注我们

原文链接：https://yq.aliyun.com/articles/98408

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark Streaming和Flink的Word Count对比

准备： nccat for windows/linux 都可以通过 TCP 套接字连接，从流数据中创建了一个 Spark DStream/ Flink DataSream, 然后进行处理, 时间窗口大小为10s因为示例需要, 所以需要下载一个netcat, 来构造流的输入。代码： spark streaming package cn.kee.spark; public final class JavaNetworkWordCount { private static final Pattern SPACE = Pattern.compile(" "); public static void main(String[] args) throws Exception { if (args.length < 2) { System.err.println("Usage: JavaNetworkWordCount <hostname> <port>"); System.exit(1); } StreamingExamples.setStreamingLogL...

2017-05-01

673

本节书摘来异步社区《Hadoop技术详解》一书中的第2章，第2.5节，作者：【美】Eric Sammer 译者：刘敏 , 麦耀锋 , 李冀蕾 , 等，更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.5　管理文件系统元数据 NameNode将文件系统的元数据以不同的文件保存在本地磁盘中，其中最重要的两个文件是fsimage和edits。和数据库一样，fsimage包含文件系统元数据的完整快照，而edits仅包含元数据的增量修改。对高吞吐率的数据存储而言，一个常用方法是使用预写日志（WAL），如edits文件，实现顺序增加操作来减少I/O操作（在NameNode中，所有操作都在RAM中完成），从而避免高消耗的查找操作，获取更好的整体性能。NameNode启动后，直接加载fsimage到RAM，再通过回放引入edits的增量变化，最终在内存中建立拥有最新信息的文件系统视图。在Hadoop较新的几个版本中（具体地说，就是Apache Hadoop 2.0和CDH4；有关Hadoop更多版本信息，请参见4.1节“挑选Hadoop的发行版本”），底层元数据的存储拥有更好的可恢复性和...

2017-05-01

568

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。