从原理剖析带你理解Stream

摘要:Stream是jdk1.8给我们提供的新特性

本文分享自华为云社区《深入理解Stream之原理剖析》,作者: 李哥技术 。

Stream是jdk1.8给我们提供的新特性,主要就是允许我们采用声明式的方式处理数据集合,我们要知道在项目中我们集合就是我们最常用的数据存储结构,有时后我们需要对集合内的元素做一些过滤或者其他的操作我们一般是采用for循环的方式。

Stream操作分类

Stream中的操作可以分为两大类:中间操作与结束操作。

中间操作只会进行操作记录,只有结束操作才会触发实际的计算,可以理解为懒加载,这也是Stream在操作大对象迭代计算的时候如此高效的原因之一。

中间操作分为有状态操作与无状态操作,无状态是指元素的处理不受之前元素的影响,有状态是指该操作只有拿到所有元素之后才能继续下去。这也比较好理解,比如有状态的distinct()去重方法,你说他能不关心其他值吗?当然不能,他必须拿到所有元素才知道当前迭代的元素是否被重复。

结束操作可以分为短路与非短路操作,这个应该很好理解,短路是指遇到某些符合条件的元素就可以得到最终结果;而非短路是指必须处理所有元素才能得到最终结果。

之所以要进行如此精细的划分,是因为底层对每一种情况的处理方式不同。

Stream结构分析

让我们先简单看看下面一段代码:

 List<String> list = new ArrayList<>();
 // 获取stream1
 Stream<String> stream1 = list.stream();
 // stream1通过filter后得到stream2
 Stream<String> stream2 = stream1.filter("lige"::equals);
 // stream1与stream2是同一个对象吗?
 System.out.println("stream1.equals(stream2) = " + stream1.equals(stream2));
 System.out.println("stream1.classTypeName = " + stream1.getClass().getTypeName());
 System.out.println("stream2.classTypeName = " + stream2.getClass().getTypeName());
 // 结果
 // stream1.equals(stream2) = false
 // stream1.classTypeName = java.util.stream.ReferencePipeline$Head
 // stream1.classTypeName = java.util.stream.ReferencePipeline$2

很明显,stream1与stream2不是同一个对象,并且他们不是同一个实现类。stream1的实现类为ReferencePipeline$Head,而stream2的实现类为一个匿名内部类,让我们进步一分析其源码,所谓源码之下,无所遁形。

让我们再看看stream2:

通过分析我们可以发现,stream2的实现类是StatelessOp,所以就形成了这样一个结构。

每一次中间操作都会生成一个新的Stream,如果是无状态操作则实现类是StatelessOp,如果是有状态操作则实现类是StatefulOp。

让我们再来看一下他们之间的继承关系。

再聊核心Sink

实际上Stream API内部实现的的本质,就是如何重载Sink的这四个接口方法。

我还是从一个示例开始:

List<String> list = new ArrayList<>();
list.add("zhangsan");
list.add("ligeligeligeligeligeligeligeligeligelige");
list.add("lisilisilisilisilisilisilisilisi");
list.add("wangwu");
list.add("ligejishuligejishuligejishuligejishuligejishuligejishuligejishu");
List<String> resultList = list.stream()
 .filter(it -> it.contains("li"))// 1. 只要包含li的数据
 .filter(it -> it.contains("lige"))// 2. 只要包含lige的数据
 .map(String::toUpperCase)// 3. 对符合的数据作进一步加工,转换大写
 .map(String::toLowerCase)// 4. 对符合的数据作进一步加工,转换小写
 .collect(Collectors.toList());
resultList.forEach(System.out::println);

不管是filter方法,还是map方法,还是其他的方法,我们进入到源码层面,返回了一个StatelessOp对象或StatefulOp对象。

所以便产生了这样一个结构:

但是和Sink有什么关系呢?我们再反过来看filter或者map源码:

直接返回一个匿名StatelessOp对象,实现opWrapSink方法,opWrapSink方法是传入一个sink对象,返回另一个sink对象。而新的sink对象拥有传入sink对象的引用。

但是,这个代码有什么用?什么时候触发的呢?

别着急,让我们从collect(Collectors.toList())方法开始一步一步深入研究。

这里我们需要知道传入xx方法的终端对象是ReduceOp,并且这个ReduceOp对象在makeSink的时候返回了一个匿名内部类ReducingSink对象。

这里的makeSink我们提到过,返回一个匿名内部类ReducingSink对象。

先执行warpSink,再执行copyInto。直白一点就是先对Sink进行包装成链式Sink,再遍历Sink链进行copy到结果对象里。这里的两个步骤都很核心。

先看warpSink:

  1. 首次进入时,this为最后的Stream对象,从尾部向头部遍历
  2. 每次遍历时,得到一个新的Stream对象,一般为StatelessOp对象或StatefulOp对象
  3. 执行操作对象的opWrapSink方法,这就是匿名实现了。
  4. 在每一个opWrapSink实现方法中,传入了上一个sink,最终得到一个sink链表

最后,返回Sink链的头节点,内部称之为包装好的sink,命名wrapped,随后,准备进行执行begin,forEachRemaining,end方法。

forEachRemaning最终调用accept方法。

动画理解Stream执行流程

 

点击关注,第一时间了解华为云新鲜技术~

优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/4526289/blog/5572070

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。