java8读书笔记:探究java8流收集数据原理

Wesley13
• 阅读 408

java8专栏目录:

  1. java8实战读书笔记:Lambda表达式语法与函数式编程接口

  2. java8实战读书笔记:复合Lambda表达式

  3. java8实战读书笔记:初识Stream、流的基本操作(流计算)

  4. java8实战读书笔记:数值流、Stream创建与Optional类的使用

本文揭示如何学习一门新技术,从示例入手,重点阐述Stream#collect方法的实现原理,为更好的使用java8中流来收集数据。

我们在前面的文章中反复使用的场景:获取菜单中所有菜品的名称,返回一个集合,其代码如下:

1public static void test_toList(List<Dish> menu) {2    List<String> names = menu.stream().map(Dish::getName)3                        .collect(Collectors.toList()); // @145    for(String s : names) {6        System.out.println(s);7    }8}

通过Stream.collect这个终端操作进行数据收集,至于如何收集,则由该方法的参数来决定(Collector),即行为参数化。

代码@1:collect(Collectors.toList()) 的意思就是返回List,这里涉及到两个关键,一个是Stream#collect方法,另外一个就是其参数Collectors.toList()。

接下来我们将以上述两个突破点来揭开如何使用java8的流来收集数据。

Stream#collect

 1ReferencePipeline#collect 2 3public final <R, A> R collect(Collector<? super P_OUT, A, R> collector) {   // @1 4    A container; 5    if (isParallel() 6            && (collector.characteristics().contains(Collector.Characteristics.CONCURRENT)) 7            && (!isOrdered() || collector.characteristics().contains(Collector.Characteristics.UNORDERED))) {   // @2 8        container = collector.supplier().get();                                                                 // @3 9        BiConsumer<A, ? super P_OUT> accumulator = collector.accumulator();10        forEach(u -> accumulator.accept(container, u));11    }12    else {                                                                                                     // @413        container = evaluate(ReduceOps.makeRef(collector));                                                                                              14    }15    return collector.characteristics().contains(Collector.Characteristics.IDENTITY_FINISH)                    // @516           ? (R) container17           : collector.finisher().apply(container);18}

代码@1:函数声明,该方法返回的结果类型为R,传入的行为参数接口为Collector。

代码@2:判断是否符合并行化累积与规约的条件。

  • 是否是并行流,例如上例中创建流的代码为menu.stream(),该方法的流是非并行化流,如果要支持并行化执行,需要满足的第一个条件就是需要使用menu.parallelStream()方法返回的流。

  • Collector(收集器,行为化参数)中收集器行为集合中是否包含Characteristics.CONCURRENT(并行执行),如果不包含该行为,则不支持并行执行。

  • 原始流是否有顺序 或 者 收集器的行为集合中明确包含Characteristics.UNORDERED(不要求顺序性)。
    上述三个条件必须同时满足,才能并行执行,否则串行执行。

代码@3:并行执行收集动作。

代码@4:串行执行收集动作。

代码@5:如果收集器收集行为集合中包含Characteristics.IDENTITY_FINISH,则直接返回原始值,否则使用Collector.finishier()方式对计算的值进行函数式计算。

通过上面的代码,我们应该对Characteristics枚举类型中的3个值不难得出如下类型:

  • CONCURRENT
    收集器行为,表示收集其中的累积函数是否支持并行执行。

  • Characteristics.UNORDERED
    收集器行为,表示整个收集期间,没有顺序要求。

  • Characteristics.IDENTITY_FINISH
    收集器行为,表示可以忽略Collector.finsher()定义的最终转换函数,直接返回累积之后的结果即可。

疑问?代码@3,这段代码不是很好理解,该怎么继续往下深入呢?

针对上面看不太懂的代码,我的处理办法是先转移思路,看一下Collector接口以及示例中Collectos.toList()返回的收集器是什么(重点关注返回的Collector中具体属性)。

Collector接口

java8读书笔记:探究java8流收集数据原理

收集器中的泛型参数说明如下:

  • T :累积器中一个操作数类型

  • A: 累积器中的初始值类型

  • R:返回值的类型,例如List< R >。

其属性一览如下:

  • Supplier< A > supplier()
    该函数式接口,大家应该都非常熟悉了,其函数声明如下:() -> T,通常用于构建对象,那这里是构建什么对象呢?这是下一个待解疑问。

  • BiConsumer accumulator()
    从名字命名来看,应该是返回累积器,(T,U)-> void。通常用于输入两个参数,对其进行处理,但返回void类型。

  • BinaryOperator< A > combiner()
    从名字命令来看,应该是组合器(请参考流计算函数reduce)。

  • Function finisher()
    最终函数,如果收集器行为包含IDENTITY_FINISH,则无需使用该函数对累积器产生的结果进行处理,否则使用该函数对累积器结果进行最后的处理。

  • Set< Characteristics > characteristics()
    累积器行为,在上文已做详细介绍。

其supplier函数到底是干什么的呢?对上面的方法都是基于名字来推测的(当然JDK代码非常优雅,根据名字去猜测,准确度还是很高的),但如何确认呢?这个时候我们还是结合Collectos.toList()方法返回的Collector来做进一步推断。

Collectors.toList()

代码如下:

1public static <T> Collector<T, ?, List<T>> toList() {2    return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,3                               (left, right) -> { left.addAll(right); return left; },4                               CH_ID);5}
  • Collector的第一个参数Supplier,在这里为ArrayList::new,即调用supper.get()方法将返回一个List。

  • Collector的第二个参数accumulator:累积器,这里是List:add方法。

  • Collector的第三个参数combiner:组合器,这里就是(left, right) -> {left.addAll(right);return left;}

  • Collector的第四个函数characteristics:收集器的行为,这里为CH_IL,其选项为:IDENTITY_FINISH。

有了上面这些知识,我们再来看如下这段代码:

java8读书笔记:探究java8流收集数据原理

1、A container:累积器的初始值,如果使用Collectors.toList(),则这里会返回List的对象。
2、获取collector中定义的累积器。
3、遍历流,执行累积器动作,其中形式参数u,代表流中的一个个元素。

至于forEach方法,底层流的具体实现,本文就不再往深探究。

总结

java8 使用流来收集数据的基本用法:

  • 使用流stream的collect对象进行数据收集,其参数为Collector函数是编程接口,具体的收集逻辑由该接口来指定。

  • 流的收集其具备基本的属性即作用:

  • Supplier< A > supplier()
    通过该函数式编程接口,返回累积器的初始值。

  • BiConsumer accumulator
    累积器函数。

  • BinaryOperator< A > combiner
    组合器,可以参考函数式编程接口的reduce方法。

  • Set< Characteristics > characteristics
    收集器行为。

  • java8中的Collectors提供了很多默认的收集器,例如Collectors.toList()方法,下一节我们会根据该类,详细介绍在java8中默认提供的收集器,指导我们如何使用java8中的流来收集数据。

下一节,将以Collectos类为入口,详细介绍java8中默认提供的收集器,已经如何使用。


更多文章请关注公众号:

java8读书笔记:探究java8流收集数据原理

一波广告来袭,作者新书《RocketMQ技术内幕》已出版上市:

java8读书笔记:探究java8流收集数据原理

《RocketMQ技术内幕》已出版上市,目前可在主流购物平台(京东、天猫等)购买,本书从源码角度深度分析了RocketMQ NameServer、消息发送、消息存储、消息消费、消息过滤、主从同步HA、事务消息;在实战篇重点介绍了RocketMQ运维管理界面与当前支持的39个运维命令;并在附录部分罗列了RocketMQ几乎所有的配置参数。本书得到了RocketMQ创始人、阿里巴巴Messaging开源技术负责人、Linux OpenMessaging 主席的高度认可并作序推荐。目前是国内第一本成体系剖析RocketMQ的书籍。

本文分享自微信公众号 - 中间件兴趣圈(dingwpmz_zjj)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
2年前
java8实战读书笔记:复合Lambda表达式
本节将重点探讨复合Lambda表达式的使用。在阅读本篇之前建议您先阅读:java8实战读书笔记:Lambda表达式语法与函数式编程接口,因为本篇是上篇的补充。(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIzNzgy
Stella981 Stella981
2年前
C++ OpenCV视频操作之KLT稀疏光流对象跟踪(二)
前言上一篇《COpenCV视频操作之KLT稀疏光流对象跟踪(一)(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzA4Nzk0NTU0Nw%3D%3D%26mid%3D2247486213%26idx%
Wesley13 Wesley13
2年前
Java 8新特性终极指南
在JavaCodeGeeks上已经有大量的关于Java8的教程了,像玩转Java8——lambda与并发(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.javacodegeeks.com%2F2014%2F04%2Fplayingwithjava8lambdas
Wesley13 Wesley13
2年前
LEAD函数在数据分析中的应用
点击上方SQL数据库开发,关注获取SQL视频教程SQL专栏SQL数据库基础知识汇总(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzA3MTg4NjY4Mw%3D%3D%26mid%3D2457300844
Wesley13 Wesley13
2年前
JDK14祭出新特性,Lombok要被终结了!
99套Java企业级实战项目(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzAxNDMwMTMwMw%3D%3D%26mid%3D2247494978%26idx%3D1%26sn%3D46ae99739689436a24
Wesley13 Wesley13
2年前
Java8—一万字的Lambda表达式的详细介绍与应用案例
  基于Java8详细介绍了lambda表达式的语法与使用,以及方法引用、函数式接口、lambda复合等Java8的新特性!文章目录1Lambda的概述2函数式接口2.1Consumer消费型接口2.2Supplier供给型接口2.3Function<T,R函数型接口
Wesley13 Wesley13
2年前
Java面试题阶段汇总
点击上方“Java知音”,选择“置顶公众号”技术文章第一时间送达!知音专栏 Javaweb练手项目源码(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI4Njc5NjM1NQ%3D%3D%26mid
Stella981 Stella981
2年前
Django实战
Django实战生鲜电商删除购物车数据|退出(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzUyMDkxNTk1Ng%3D%3D%26mid%3D2247485434%26idx%3D1%26sn%3Dd719b92c
Wesley13 Wesley13
2年前
Java 并发编程:如何防止在线程阻塞与唤醒时死锁
Java并发编程:多线程如何实现阻塞与唤醒(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzU3OTc1MDM1Mg%3D%3D%26mid%3D2247494798%26idx%3D1%26sn%3D4b27253ee84
Stella981 Stella981
2年前
Hadoop极简入门
建议复习:分布式理论基础和原理(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzU3MzgwNTU2Mg%3D%3D%26mid%3D2247483953%26idx%3D1%26sn%3Ddb7