从零开始学习Java8 Stream,看这篇就够了
为何需要引入流 在我们平常的开发中几乎每天都会有到List、Map等集合API,若是问Java什么API使用最多,我想也应该是集合了。举例:假如我有个集合List,里面元素有1,7,3,8,2,4,9,需要找出里面大于5的元素,具体实现代码: public List<integer> getGt5Data() { List<integer> data = Arrays.asList(1, 7, 3, 8, 2, 4, 9); List<integer> result = new ArrayList<>(); for (Integer num : data) { if (num > 5) { result.add(num); } } return result; } 这个实现让我们感觉到了集合的操作不是太完美,如果是数据库的话,我们只需要简单的在where后面加一个条件大于5就可以得到我们想要的结果,为什么Java的集合就没有这种API呢? 其次,如果我们遇到有大集合需要处理,为了提高性能,我们可能需要使用到多线程来处理,但是写并行程序的复杂度有提高了不少。 基于以上的问题,所有Java8推出了Stream Stream简介 Stream有哪些特点: 元素的序列:与集合一样可以访问里面的元素,集合讲的是数据,而流讲的是操作,比如:filter、map 源: 流也需要又一个提供数据的源,顺序和生成时的顺序一致 数据的操作:流支持类似于数据库的操作,支持顺序或者并行处理数据;上面的例子用流来实现会更加的简洁 public List<integer> getGt5Data() { return Stream.of(1, 7, 3, 8, 2, 4, 9) .filter(num -> num > 5) .collect(toList()); } 流水线操作:很多流的方法本身也会返回一个流,这样可以把多个操作连接起来,形成流水线操作 内部迭代:与以往的迭代不同,流使用的内部迭代,用户只需要专注于数据处理 只能遍历一次: 遍历完成之后我们的流就已经消费完了,再次遍历的话会抛出异常 使用Stream Java8中的Stream定义了很多方法,基本可以把他们分为两类:中间操作、终端操作;要使用一个流一般都需要三个操作: 定义一个数据源 定义中间操作形成流水线 定义终端操作,执行流水线,生成计算结果 构建流 使用Stream.of方法构建一个流 Stream.of("silently","9527","silently9527.cn") .forEach(System.out::println); 使用数组构建一个流 int[] nums = {3, 5, 2, 7, 8, 9}; Arrays.stream(nums).sorted().forEach(System.out::println); 通过文件构建一个流 使用java.nio.file.Files.lines方法可以轻松构建一个流对象 Files.lines(Paths.get("/Users/huaan9527/Desktop/data.txt")) .forEach(System.out::println); 中间操作 中间操作会返回另外一个流,这样可以让多个操作连接起来形成一个流水线的操作,只要不触发终端操作,那么这个中间操作都不会实际执行。 filter 该操作接受一个返回boolean的函数,当返回false的元素将会被排除掉 举例:假如我们100个客户,需要筛选出年龄大于20岁的客户 List<customer> matchCustomers = allCustomers.stream() .filter(customer -> customer.getAge()>20) .collect(toList()); distinct 该操作将会排除掉重复的元素 List<integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9) .filter(num -> num > 5) .distinct() .collect(toList()); limit 该方法限制流只返回指定个数的元素 List<integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9) .filter(num -> num > 5) .limit(2) .collect(toList()); skip 扔掉前指定个数的元素;配合limit使用可以达到翻页的效果 List<integer> data = Stream.of(1, 7, 3, 8, 2, 4, 9, 7, 9) .filter(num -> num > 5) .skip(1) .limit(2) .collect(toList()); map 该方法提供一个函数,流中的每个元素都会应用到这个函数上,返回的结果将形成新类型的流继续后续操作。 举例:假如我们100个客户,需要筛选出年龄大于20岁的客户,打印出他们的名字 allCustomers.stream() .filter(customer -> customer.getAge() > 20) .map(Customer::getName) .forEach(System.out::println); 在调用map之前流的类型是Stream<customer>,执行完map之后的类型是Stream<string> flatMap 假如我们需要把客户的名字中的每个字符打印出来,代码如下: List<customer> allCustomers = Arrays.asList(new Customer("silently9527", 30)); allCustomers.stream() .filter(customer -> customer.getAge() > 20) .map(customer -> customer.getName().split("")) .forEach(System.out::println); 执行本次结果,你会发现没有达到期望的结果,打印的结果 [Ljava.lang.String;@38cccef 这是因为调用map之后返回的流类型是Stream<string[]>,所有forEach的输入就是String[];这时候我们需要使用flatMap把String[]中的每个元素都转换成一个流,然后在把所有的流连接成一个流,修改后的代码如下 List<customer> allCustomers = Arrays.asList(new Customer("silently9527", 30)); allCustomers.stream() .filter(customer -> customer.getAge() > 20) .map(customer -> customer.getName().split("")) .flatMap(Arrays::stream) .forEach(System.out::println); 执行结果: sorted 对所有的元素进行排序 List<integer> numbers = Arrays.asList(1, 7, 3, 8, 2, 4, 9); numbers.stream().sorted(Integer::compareTo).forEach(System.out::println); 终端操作 终端操作会执行所有的中间操作生成执行的结果,执行的结果不在是一个流。 anyMatch 如果流中有一个元素满足条件将返回true if (allCustomers.stream().anyMatch(customer -> "silently9527".equals(customer.getName()))) { System.out.println("存在用户silently9527"); } allMatch 确保流中所有的元素都能满足 if (allCustomers.stream().allMatch(customer -> customer.getAge() > 20)) { System.out.println("所有用户年龄都大于20"); } noneMatch 与allMatch操作相反,确保流中所有的元素都不满足 if (allCustomers.stream().noneMatch(customer -> customer.getAge() < 20)) { System.out.println("所有用户年龄都大于20"); } findAny 返回流中的任意一个元素,比如返回大于20岁的任意一个客户 Optional<customer> optional = allCustomers.stream() .filter(customer -> customer.getAge() > 20) .findAny(); findFirst 返回流中的第一个元素 Optional<customer> optional = allCustomers.stream() .filter(customer -> customer.getAge() > 20) .findFirst(); reduce 接受两个参数:一个初始值,一个BinaryOperator<t> accumulator将两个元素合并成一个新的值 比如我们对一个数字list累加 List<integer> numbers = Arrays.asList(1, 7, 3, 8, 2, 4, 9); Integer sum = numbers.stream().reduce(0, (a, b) -> a + b); 上面的代码,我们可以简写 Integer reduce = numbers.stream().reduce(0, Integer::sum); 找出流中的最大值、最小值 min、max numbers.stream().reduce(Integer::max) numbers.stream().reduce(Integer::min) count 统计流中元素的个数 numbers.stream().count() 数据收集器collect 在Java8中已经预定义了很多收集器,我们可以直接使用,所有的收集器都定义在了Collectors中,基本上可以把这些方法分为三类: 将元素归约和汇总成一个值 分组 分区 归约和汇总 先看下我们之前求最大值和最小值采用收集器如何实现 找出年龄最大和最小的客户 Optional<customer> minAgeCustomer = allCustomers.stream().collect(minBy(Comparator.comparing(Customer::getAge))); Optional<customer> maxAgeCustomer = allCustomers.stream().collect(maxBy(Comparator.comparing(Customer::getAge))); 求取年龄的平均值 Double avgAge = allCustomers.stream().collect(averagingInt(Customer::getAge)); 进行字符串的连接 把客户所有人的名字连接成一个字符串用逗号分隔 allCustomers.stream().map(Customer::getName).collect(joining(",")); 分组 在数据库的操作中,我们可以轻松的实现通过一个属性或者多个属性进行数据分组,接下来我们看看Java8如何来实现这个功能。 根据客户的年龄进行分组 Map<integer, list<customer>> groupByAge = allCustomers.stream().collect(groupingBy(Customer::getAge)); Map的key就是分组的值年龄,List<customer>就是相同年龄的用户 我们需要先按照用户的地区分组,在按年龄分组 Map<string, map<integer, list<customer>>> groups = allCustomers.stream() .collect(groupingBy(Customer::getArea, groupingBy(Customer::getAge))); 在相对于普通的分组,这里多传了第二个参数又是一个groupingBy;理论上我们可以通过这个方式扩展到n层分组 分组后再统计数量 Map<string, long> groupByCounting = allCustomers.stream() .collect(groupingBy(Customer::getArea, counting())); 以用户所在地区分组后找出年龄最大的用户 Map<string, optional<customer>> optionalMap = allCustomers.stream() .collect(groupingBy(Customer::getArea, maxBy(Comparator.comparing(Customer::getAge)))); 这时候返回的Map中的value被Optional包裹,如果我们需要去掉Optional,可以使用collectingAndThen Map<string, customer> customerMap = allCustomers.stream() .collect(groupingBy(Customer::getArea, collectingAndThen(maxBy(Comparator.comparing(Customer::getAge)), Optional::get) )); 写在最后(看完不点赞,你们想白嫖我吗) 首先感谢大家可以耐心地读到这里。点关注,不迷路 当然,文中或许会存在或多或少的不足、错误之处,有建议或者意见也非常欢迎大家在评论交流。 最后,白嫖不好,创作不易,希望朋友们可以点赞评论关注三连,因为这些就是我分享的全部动力来源🙏 > 原创不易 转载请注明出处:https://silently9527.cn/archives/66 参数资料《Java8实战》