java8之Stream API(从迭代器到Stream操作)

Wesley13
• 阅读 462

当你处理集合时,通常会迭代所有元素并对其中的每一个进行处理。例如,假设我们希望统计一个文件中的所有长单词:

package java8test;

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.List;

public class T5 {
    public static void main(String[] args) {
        try {
            String contents = new String(Files.readAllBytes(
                    Paths.get("/home/fuhd/work/workspace/javaee/wwos.platform/pom.xml")),
                    StandardCharsets.UTF_8);
            List<String> words = Arrays.asList(contents.split("\n")); 
            //进行迭代
            int count = 0;
            for(String w: words){
                if(w.length() > 12) count++;
            }
            System.out.println(count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

这里面有什么错误吗?其实没有——只是它很难被并行计算。这也是java8引入大量操作符的原因。在Java8中,实现相同功能的操作符如下所示:

package java8test;

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.List;

public class T5 {
    public static void main(String[] args) {
        try {
            String contents = new String(Files.readAllBytes(
                    Paths.get("/home/fuhd/work/workspace/javaee/wwos.platform/pom.xml")),
                    StandardCharsets.UTF_8);
            List<String> words = Arrays.asList(contents.split("\n")); 
            //注意这一句
            long count = words.stream().filter(w -> w.length() > 12).count();
            System.out.println(count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

stream方法会为单词列表生成一个Stream。filter方法会返回另一个只包含单词长度大于12的Stream。count方法会将Stream化简为一个结果。

一个Stream表面上看与一个集合很类似,允许你改变和获取数据。但是实际上它与集合是有很大区别的:

  • Stream自己不会存储元素。元素可能被存储在底层的集合中,或者根据需要产生出来。

  • Stream操作符不会改变源对象。相反,它们会返回一个持有结果的新Stream。

  • Stream操作符可能是延迟执行的。这意味着它们会等到需要结果的时候才执行。

许多人发现Stream表达式比循环的可读性更好。此外,它们还很容易进行并行执行。以下是一段如何并行统计长单词的代码:

package java8test;

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.List;

public class T5 {
    public static void main(String[] args) {
        try {
            String contents = new String(Files.readAllBytes(
                    Paths.get("/home/fuhd/work/workspace/javaee/wwos.platform/pom.xml")),
                    StandardCharsets.UTF_8);
            List<String> words = Arrays.asList(contents.split("\n")); 
            //注意这一句,stream()改成了parallelStream()方法
            long count = words.parallelStream().filter(w -> w.length() > 12).count();
            System.out.println(count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

只要将stream()方法改成parallelStream方法,就可以让Stream API并行执行过滤和统计操作。

Stream遵循“做什么,而不是怎么去做”的原则。在我们的示例中,描述了需要做什么:获得长单词并对它们的个数进行统计。我们没有指定按照什么顺序,或者在哪个线程中做,它们都是理所应当发生的。相反,循环在一开始就需要指定如何进行计算,因此就失去了优化的机会。

当你使用Stream时,你会通过三个阶段来建立一个操作流水线:

  • 创建一个Stream。

  • 在一个或多个步骤中,指定将初始Stream转换为另一个Stream的中间操作。

  • 使用一个终止操作来产生一个结果。该操作会强制它之前的延迟操作立即执行。在这之后,该Stream就不会再被使用

在我们的示例中,通过stream或者parallelStream方法来创建Stream,再通过filter方法对其进行转换,而count就是终止操作

注意:Stream操作不会按照元素的调用顺序执行。在我们的例子中,只有在count被调用的时候才会执行Stream操作。当count方法需要第一个元素时,filter方法会开始请求各个元素,直到找到一个长度大于12的元素。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
2年前
Java获得今日零时零分零秒的时间(Date型)
publicDatezeroTime()throwsParseException{    DatetimenewDate();    SimpleDateFormatsimpnewSimpleDateFormat("yyyyMMdd00:00:00");    SimpleDateFormatsimp2newS
Wesley13 Wesley13
2年前
Java日期时间API系列31
  时间戳是指格林威治时间1970年01月01日00时00分00秒起至现在的总毫秒数,是所有时间的基础,其他时间可以通过时间戳转换得到。Java中本来已经有相关获取时间戳的方法,Java8后增加新的类Instant等专用于处理时间戳问题。 1获取时间戳的方法和性能对比1.1获取时间戳方法Java8以前
Stella981 Stella981
2年前
Python之time模块的时间戳、时间字符串格式化与转换
Python处理时间和时间戳的内置模块就有time,和datetime两个,本文先说time模块。关于时间戳的几个概念时间戳,根据1970年1月1日00:00:00开始按秒计算的偏移量。时间元组(struct_time),包含9个元素。 time.struct_time(tm_y
Wesley13 Wesley13
2年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Docker 部署SpringBoot项目不香吗?
  公众号改版后文章乱序推荐,希望你可以点击上方“Java进阶架构师”,点击右上角,将我们设为★“星标”!这样才不会错过每日进阶架构文章呀。  !(http://dingyue.ws.126.net/2020/0920/b00fbfc7j00qgy5xy002kd200qo00hsg00it00cj.jpg)  2
Stella981 Stella981
2年前
OpenCV访问像素点
三种方法迭代器创建一个Mat::Iterator对象it,通过itMat::begin()来的到迭代首地址,递增迭代器知道itMat::end()结束迭代;while(it!Scr.end<Vec3b()){//(it)00;//蓝色通道置零;
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这