nodejs可读流源码分析-低调大师

nodejs可读流源码分析

2020-07-19 667

可读流是对数据消费的抽象，nodejs中可读流有两种工作模式：流式和暂停式，流式就是有数据的时候就会触发回调，并且把数据传给回调，暂停式就是需要用户自己手动执行读取的操作。我们通过源码去了解一下可读流实现的一些逻辑。因为实现的代码比较多，逻辑也比较绕，本文只分析一些主要的逻辑，有兴趣的可以参考文档或者自行深入看源码了解细节。我们先看一下ReadableState，这个对象是表示可读流的一些状态和属性的。

function ReadableState(options, stream) {
  options = options || {};
  // 是否是双向流
  var isDuplex = stream instanceof Stream.Duplex;
  // 数据模式
  this.objectMode = !!options.objectMode;
  // 双向流的时候，设置读端的模式
  if (isDuplex)
    this.objectMode = this.objectMode || !!options.readableObjectMode;
  // 读到highWaterMark个字节则停止，对象模式的话则是16个对象
  this.highWaterMark = getHighWaterMark(this, 
                                          options, 
                                          'readableHighWaterMark',
                                        isDuplex);
  // 存储数据的缓冲区
  this.buffer = new BufferList();
  // 可读数据的长度
  this.length = 0;
  // 管道的目的源和个数
  this.pipes = null;
  this.pipesCount = 0;
  // 工作模式
  this.flowing = null;
  // 流是否已经结束
  this.ended = false;
  // 是否触发过end事件了
  this.endEmitted = false;
  // 是否正在读取数据
  this.reading = false;

  // 是否同步执行事件
  this.sync = true;

  // 是否需要触发readable事件
  this.needReadable = false;
  // 是否触发了readable事件
  this.emittedReadable = false;
  // 是否监听了readable事件
  this.readableListening = false;
  // 是否正在执行resume的过程
  this.resumeScheduled = false;

  // has it been destroyed
  // 流是否已销毁
  this.destroyed = false;

  // 数据编码格式
  this.defaultEncoding = options.defaultEncoding || 'utf8';

  // 在管道化中，有多少个写者已经达到阈值，需要等待触发drain事件,awaitDrain记录达到阈值的写者个数
  this.awaitDrain = 0;

  // 执行maybeReadMore函数的时候，设置为true
  this.readingMore = false;

  this.decoder = null;
  this.encoding = null;
  // 编码解码器
  if (options.encoding) {
    if (!StringDecoder)
      StringDecoder = require('string_decoder').StringDecoder;
    this.decoder = new StringDecoder(options.encoding);
    this.encoding = options.encoding;
  }
}

ReadableState里包含了一大堆字段，我们可以先不管他，等待用到的时候，再回头看。接着我们开始看可读流的实现。

function Readable(options) {
  if (!(this instanceof Readable))
    return new Readable(options);

  this._readableState = new ReadableState(options, this);
  // 可读
  this.readable = true;
  // 用户实现的两个函数
  if (options) {
    if (typeof options.read === 'function')
      this._read = options.read;

    if (typeof options.destroy === 'function')
      this._destroy = options.destroy;
  }
  // 初始化父类
  Stream.call(this);
}

上面的逻辑不多，需要关注的是read和destroy这两个函数，如果我们是直接使用Readable使用可读流，那再options里是必须传read函数的，destroy是可选的。如果我们是以继承的方式使用Readable，那必须实现_read函数。nodejs只是抽象了流的逻辑，具体的操作（比如可读流就是读取数据）是由用户自己实现的，因为读取操作是业务相关的。下面我们分析一下可读流的操作。

1 可读流从底层资源获取数据

对用户来说，可读流是用户获取数据的地方，但是对可读流来说，他提供数据给用户的前提是他自己得有数据，所以可读流首先需要生产数据。生产数据的逻辑由_read函数实现。_read函数的逻辑大概是

const data = getSomeData();
readableStream.push(data);

通过push函数，往可读流里写入数据，然后就可以为用户提供数据，我们看看push的实现，只列出主要逻辑。

Readable.prototype.push = function(chunk, encoding) {
  // 省略了编码处理的代码
  return readableAddChunk(this, chunk, encoding, false, skipChunkCheck);
};

function readableAddChunk(stream, chunk, encoding, addToFront, skipChunkCheck) {
  var state = stream._readableState;
  // push null代表流结束
  if (chunk === null) {
    state.reading = false;
    onEofChunk(stream, state);
  } else {
      addChunk(stream, state, chunk, false);
  }
  // 返回是否还可以读取更多数据
  return needMoreData(state);
}

function addChunk(stream, state, chunk, addToFront) {
  // 是流模式并且缓存没有数据，则直接触发data事件
  if (state.flowing && state.length === 0 && !state.sync) {
    stream.emit('data', chunk);
  } else {
    // 否则先把数据缓存起来
    state.length += state.objectMode ? 1 : chunk.length;
    if (addToFront)
      state.buffer.unshift(chunk);
    else
      state.buffer.push(chunk);
    // 监听了readable事件，则触发readable事件
    if (state.needReadable)
      emitReadable(stream);
  }
  // 继续读取数据，如果可以的话
  maybeReadMore(stream, state);
}

总的来说，可读流首先要从某个地方获取数据，根据当前的工作模式，直接交付给用户，或者先缓存起来。并可以的情况下，继续获取数据。

2 用户从可读流获取数据

用户可以通过read函数或者监听data事件来从可读流中获取数据

Readable.prototype.read = function(n) {
  n = parseInt(n, 10);
  var state = this._readableState;
  // 计算可读的大小
  n = howMuchToRead(n, state);
  var ret;
  // 需要读取的大于0，则取读取数据到ret返回
  if (n > 0)
    ret = fromList(n, state);
  else
    ret = null;
  // 减去刚读取的长度
  state.length -= n;
  // 如果缓存里没有数据或者读完后小于阈值了，则可读流可以继续从底层资源里获取数据
  if (state.length === 0 || state.length - n < state.highWaterMark) {
     this._read(state.highWaterMark);
  }
  // 触发data事件
  if (ret !== null)
    this.emit('data', ret);

  return ret;
};

读取数据的操作就是计算缓存里有多少数据可以读，和用户需要的数据大小，取小的，然后返回给用户，并触发data事件。如果数据还没有达到阈值，则触发可读流从底层资源中获取数据。

3销毁流

function destroy(err, cb) {
  // 设置已销毁标记
  if (this._readableState) {
    this._readableState.destroyed = true;
  }
  // 执行_destroy钩子函数，用户可以重写这个函数
  this._destroy(err || null, (err) => {
    // 出错，但是没有设置回调，则执行触发error事件
    if (!cb && err) {
      process.nextTick(() => {
        this.emit('error', err);
      }, this, err);
    } else if (cb) {
      // 有回调则执行
      cb(err);
    }
  });

  return this;
}

我们看一下Readable提供的默认_destroy函数。

Readable.prototype._destroy = function(err, cb) {
  this.push(null);
  cb(err);
};

刚才分析push函数时已经看到this.push(null)表示流结束了。销毁流意味着关闭流对应的底层资源，不再提供数据服务。
总结：本文就分析到这里，流的实现代码不算很难，但是非常绕，有兴趣的可以详细看源码，最后分享很久之前画的一个图（链接https://www.processon.com/view/link/5cc7e9e5e4b09eb4ac2e0688）。

本文分享自微信公众号 - 编程杂技（theanarkh）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4217331/blog/4408870

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

将终结点图添加到你的ASP.NET Core应用程序中

在本文中，我将展示如何使用DfaGraphWriter服务在ASP.NET Core 3.0应用程序中可视化你的终结点路由。上面文章我向您演示了如何生成一个有向图（如我上篇文章[译]使用DOT语言和GraphvizOnline来可视化你的ASP.NETCore3.0终结点01中所示），可以使用GraphVizOnline将其可视化。最后，我描述了应用程序生命周期中可以检索图形数据的点。作者：依乐祝原文地址：https://www.cnblogs.com/yilezhu/p/13335749.html 译文地址：https://andrewlock.net/adding-an-endpoint-graph-to-your-aspnetcore-application/ 在本文中，我仅展示如何创建图形的“默认”样式。在我的下一批那文章中，我再创建一个自定义的writer来生成自定义的图如上篇文章所示。使用DfaGraphWriter可视化您的终结点 ASP.NET Core附带了一个方便的类DfaGraphWriter可用于可视化ASP.NET Core 3.x应用程序中的终结点路由...

2020-07-19

814

关注、星标公众号，直达精彩内容 ID：技术让梦想更伟大作者:李肖遥在C语言中，数据类型指的是用于声明不同类型的变量或函数的一个广泛的系统，我们常用的算术类型包括两种类型：整数类型和浮点类型。那么相互之间具体是怎么转化的呢？了解一下类型转换不同数据类型的存储大小和值范围是不一样的，程序在初始化的时候就已经设定了，例如： inta=9;floatb=8.5; a，b占的字节大小不一样，这个我们应该都知道，在C语言中一个表达式允许不同类型的数据进行运算，例如: inta=9;floatb=8.5，c;c=a+b; 因为计算机硬件在进行算术操作时，要求各操作数的类型具有相同的存储位数以及一样的存储方式，所以就出现了类型转换。对于某些类型的转换，编译器可以隐式地自动进行，这种转换称为自动类型转换；而有些类型转换需要程序员显式指明，那么通常把这种转换称为强制类型转换。自动类型转换自动转换是在源类型和目标类型兼容以及目标类型广于源类型时发生一个类型到另一类的转换。我们先来看一段代码 //vs2019//来源：技术让梦想更伟大//作者：李肖遥#include<stdio.h&g...

2020-07-20

718

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。