java8-用流收集数据-6

本章内容
口用co1lectors类创建和使用收集器
口将数据流归约为一个值
口汇总:归约的特殊情况
数据分组和分区口
口 开发自己的自定义收集器

    我们在前一章中学到,流可以用类似于数据库的操作帮助你处理集合。你可以把Java8的流看作花哨又懒惰的数据集迭代器。它们支持两种类型的操作:中间操作(如fi1ter或map)和终端操作(如count、findrirst、forEach和reduce)。中间操作可以链接起来,将一个流转换为另一个流。这些操作不会消耗流,其目的是建立一个流水线。与此相反,终端操作会消耗流,以产生一个最终结果,例如返回流中的最大元素。它们通常可以通过优化流水线来缩短计算时间。
我们已经在第4章和第5章中用过co11ect终端操作了,当时主要是用来把stream中所有的元素结合成一个List。在本章中,你会发现co1lect是一个归约操作,就像reduce一样可以接受各种做法作为参数,将流中的元素累积成一个汇总结果。具体的做法是通过定义新的Co1lector接口来定义的,因此区分collection、collector和co1lect是很重要的。下面是一些查询的例子,看看你用collect和收集器能够做什么。口对一个交易列表按货币分组,获得该货币的所有交易额总和(返回一个Map<currency,Integer>)口将交易列表分成两组:贵的和不贵的(返回一个Map<Boolean,List<Transaction>>)。口创建多级分组,比如按城市对交易分组,然后进一步按照贵或不贵分组(返回一个Map<Boolean,List<Transaction>>激动吗?很好,我们先来看一个利用收集器的例子。想象一下,你有一个由Transaction构成的List,并且想按照名义货币进行分组。在没有Lambda的Java里,哪怕像这种简单的用例实现起来都很啰嗦,就像下面这样。

6.1 收集器简介
    前一个例子清楚地展示了函数式编程相对于指令式编程的一个主要优势:你只需指出希望的结果--“做什么”,而不用操心执行的步骤--“如何做”。在上一个例子里,传递给collect方法的参数是co1lector接口的一个实现,也就是给stream中元素做汇总的方法。上一章里的toList只是说“按顺序给每个元素生成一个列表”;在本例中,groupingBy说的是“生成一个Map,它的键是(货币)桶,值则是桶中那些元素的列表”。
要是做多级分组,指令式和函数式之间的区别就会更加明显:由于需要好多层嵌套循环和条件,指令式代码很快就变得更难阅读、更难维护、更难修改。相比之下,函数式版本只要再加上一个收集器就可以轻松地增强功能了,你会在6.3节中看到它。
6.1.1 收集器用作高级归约
刚刚的结论又引出了优秀的函数式API设计的另一个好处:更易复合和重用。收集器非常有用,因为用它可以简洁而灵活地定义co1lect用来生成结果集合的标准。更具体地说,对流调用co1lect方法将对流中的元素触发一个归约操作(由co1lector来参数化)。图6-1所示的归约操作所做的工作和代码清单6-1中的指令式代码一样。它遍历流中的每个元素,并让collector进行处理。

一般来说,collector会对元素应用一个转换函数(很多时候是不体现任何效果的恒等转换,例如toList),并将结果累积在一个数据结构中,从而产生这一过程的最终输出。例如,在前面所示的交易分组的例子中,转换函数提取了每笔交易的货币,随后使用货币作为键,将交易本身
累积在生成的Map中。如货币的例子中所示,collector接口中方法的实现决定了如何对流执行归约操作。我们会在6.5节和6.6节研究如何创建自定义收集器。但co1lectors实用类提供了很多静态工厂方法,可以方便地创建常见收集器的实例,只要拿来用就可以了。最直接和最常用的收集器是toList静态方法,它会把流中所有的元素收集到一个ist中:
 

List<Transaction>transactions=transactiongtream.collect(Collectors.toList())

6.1.2 预定义收集器
在本章剩下的部分中,我们主要探讨预定义收集器的功能,也就是那些可以从co1lectors类提供的工厂方法(例如groupingBy)创建的收集器。它们主要提供了三大功能:
口将流元素归约和汇总为一个值
口 元素分组
口 元素分区

我们先来看看可以进行归约和汇总的收集器。它们在很多场合下都很方便,比如前面例子中提到的求一系列交易的总交易额。
然后你将看到如何对流中的元素进行分组,同时把前一个例子推广到多层次分组,或把不同
的收集器结合起来,对每个子组进行进一步归约操作。我们还将谈到分组的特殊情况“分区”即使用谓词(返回一个布尔值的单参数函数)作为分组函数。
6.4节末有一张表,总结了本章中探讨的所有预定义收集器。在6.5节你将了解更多有关co1lector接口的内容。在6.6节中你会学到如何创建自己的自定义收集器,用于co1lectors类的工厂方法无效的情况。
6.2 归约和汇总
为了说明从Collectors工厂类中能创建出多少种收集器实例,我们重用一下前一章的例包含一张佳看列表的菜单!
就像你刚刚看到的,在需要将流项目重组成集合时,一般会使用收集器( stream方法co1lect的参数)。再宽泛一点来说,但凡要把流中所有的项目合并成一个结果时就可以用。这个结果可以是任何类型,可以复杂如代表一棵树的多级映射,或是简单如一个整数--也许代表了菜单的热量总和。这两种结果类型我们都会讨论:6.2.2节讨论单个整数,6.3.1节讨论多级分组。我们先来举一个简单的例子,利用counting工厂方法返回的收集器,数一数菜单里有多少种菜:

long howManyDishes = menu.stream().collect (Collectors .counting());

这还可以写得更为直接:

long howManyDishes =menu.stream().count()

counting收集器在和其他收集器联合使用的时候特别有用,后面会谈到这一点。在本章后面的部分,我们假定你已导人了co1lectors类的所有静态工厂方法:
import static java.util.stream.Collectors.*;这样你就可以写counting()而用不着写collectors.counting()之类的了。让我们来继续探讨简单的预定义收集器,看看如何找到流中的最大值和最小值。
6.2.1 查找流中的最大值和最小值
假设你想要找出菜单中热量最高的菜。你可以使用两个收集器,Collectors.maxBy和Collectors.minBy,来计算流中的最大或最小值。这两个收集器接收一个comparator参数来比较流中的元素。你可以创建一个comparator来根据所含热量对菜看进行比较,并把它传递给Collectors .maxBy:
 

Comparator<Dish>dishCaloriesComparator=Comparator.comparingInt(Dish::getCalories):
Optiona1l<Dish>mostCalorieDish=menu.stream()
.collect(maxBy(dishCaloriesComparator));

你可能在想optional<Dish>是怎么回事。要回答这个问题,我们需要问“要是menu为空怎么办”。那就没有要返回的菜了!Java8引|人了optiona1,它是一个容器,可以包含也可以不包含值。这里它完美地代表了可能也可能不返回菜看的情况。我们在第5章讲findAny方法的时候简要提到过它。现在不用担心,我们专门用第10章来研究optional<T>及其操作。另一个常见的返回单个值的归约操作是对流中对象的一个数值字段求和。或者你可能想要求平均数。这种操作被称为汇总操作。让我们来看看如何使用收集器来表达汇总操作。

6.2.3 连接字符串
joining工厂方法返回的收集器会把对流中每一个对象应用tostring方法得到的所有字符串连接成一个字符串。这意味着你把菜单中所有菜看的名称连接起来,如下所示:

String shortMenu = menu.stream().map(Dish::getName).collect (joining());

请注意,joining在内部使用了stringBuilder来把生成的字符串逐个追加起来。此外还要注意,如果Dish类有一个tostring方法来返回菜看的名称,那你无需用提取每一道菜名称的函数来对原流做映射就能够得到相同的结果:

String shortMenu =menu.stream().collect(joining());


二者均可产生以下字符串:
porkbeefchickenfrench friesriceseason fruitpizzaprawnssalmon
但该字符串的可读性并不好。幸好,joining工厂方法有一个重载版本可以接受元素之间的分界符,这样你就可以得到一个逗号分隔的菜看名称列表:

String shortMenu = menu.stream().map(Dish::getName) .collect (joining(","));

正如我们预期的那样,它会生成:
pork,beef,chicken,french fries,rice,season fruit,pizza,prawns, salmon
到目前为止,我们已经探讨了各种将流归约到一个值的收集器。在下一节中,我们会展示为什么所有这种形式的归约过程,其实都是co1lectors.reducing工厂方法提供的更广义归约收集器的特殊情况。

6.2.4 广义的归约汇总
事实上,我们已经讨论的所有收集器,都是一个可以用reducing工厂方法定义的归约过程的特殊情况而已。co11ectors.reducing工厂方法是所有这些特殊情况的一般化。可以说,先前讨论的案例仅仅是为了方便程序员而已。(但是,请记得方便程序员和可读性是头等大事!)例如,可以用reducing方法创建的收集器来计算你菜单的总热量,如下所示:

int totalCalories =menu.stream().collect(reducing(0,Dish::getCalories,(i,j)->i +j))

它需要三个参数。
口第一个参数是归约操作的起始值,也是流中没有元素时的返回值,所以很显然对于数值和而言0是一个合适的值。
口第二个参数就是你在6.2.2节中使用的函数,将菜看转换成一个表示其所含热量的int。

口第三个参数是一个Binaryoperator,将两个项目累积成一个同类型的值。这里它就是对两个int求和。同样,你可以使用下面这样单参数形式的reducing来找到热量最高的菜,如下所示:

Optional<Dish>mostCalorieDish =
menu.stream().collect(reducing((d1,d2)->dl.getCalories()>d2.getCalories()?d1 :d2));

你可以把单参数reducing工厂方法创建的收集器看作三参数方法的特殊情况,它把流中的第一个项目作为起点,把恒等函数(即一个函数仅仅是返回其输入参数)作为一个转换函数。这也意味着,要是把单参数reducing收集器传递给空流的co1lect方法,收集器就没有起点;正如我们在6.2.1节中所解释的,它将因此而返回一个optional<pish>对象。
收集与归约
在上一章和本章中讨论了很多有关归约的内容。你可能想知道,stream接口的collect和reduce方法有何不同,因为两种方法通常会获得相同的结果。例如,你可以像下面这样使用reduce方法来实现toListCollector所做的工作:
 

Stream<Integer>stream=Arrays.asList(l,2,3,4,5,6).stream();List<Integer>numbersstream.reduce(
new rrayList<Integer>()
(List<Integer>l,Integer e)->{1 .add(e);
return li
}
(List<Integer>1l,List<Integer>12)->{
11.addд11(12);
return 11;});


这个解决方案有两个问题:一个语义问题和一个实际问题。语义问题在于,reduce方法旨在把两个值结合起来生成一个新值,它是一个不可变的归约。与此相反,collect方法的设计就是要改变容器,从而累积要输出的结果。这意味着,上面的代码片段是在滥用reduce方法,因为它在原地改变了作为累加器的List。你在下一章中会更详细地看到,以错误的语义使用reduce方法还会造成一个实际问题:这个归约过程不能并行工作,因为由多个线程并发修改同一个数据结构可能会破坏List本身。在这种情况下,如果你想要线程安全,就需要每次分配一个新的List,而对象分配又会影响性能。这就是co1lect方法特别适合表达可变容器上的归约的原因,更关键的是它适合并行操作,本章后面会谈到这一点。
1.收集框架的灵活性:以不同的方法执行同样的操作你还可以进一步简化前面使用reducing收集器的求和例子--引用Integer类的sum方法,而不用去写一个表达同一操作的Lammbda表达式。这会得到以下程序:
int totalCalories =menu.stream().collect(reducing(0,4-- 初始值Dish::getCalories,◁-转换函数Integer::sum))i4- 累积函数
从逻辑上说,归约操作的工作原理如图6-3所示:利用累积函数,把一个初始化为起始值的累加器,和把转换函数应用到流中每个元素上得到的结果不断迭代合并起来。

6.3 分组
一个常见的数据库操作是根据一个或多个属性对集合中的项目进行分组。就像前面讲到按货币对交易进行分组的例子一样,如果用指令式风格来实现的话,这个操作可能会很麻烦、啰嗦而且容易出错。但是,如果用Java8所推崇的函数式风格来重写的话,就很容易转化为一个非常容易看懂的语句。我们来看看这个功能的第二个例子:假设你要把菜单中的菜按照类型进行分类,有肉的放一组,有鱼的放一组,其他的都放另一组。用collectors.groupingBy工厂方法返回的收集器就可以轻松地完成这项任务,如下所示:

Map<Dish.Type,List<Dish>>dishesByType =
menu.stream().collect(groupingBy(Dish::getType));

其结果是下面的Map:
(FISH=lprawns,salmon],0THER=[french fries,rice,season fruit,pizza],MEAT=[pork,beef,chickenl}
这里,你给groupingBy方法传递了一个Function(以方法引用的形式),它提取了流中每:道Dish的Dish.ype。我们把这个Function叫作分类函数,因为它用来把流中的元素分成不同的组。如图6-4所示,分组操作的结果是一个ap,把分组函数返回的值作为映射的键,把流中所有具有这个分类值的项目的列表作为对应的映射值。在菜单分类的例子中,键就是菜的类型,

但是,分类函数不一定像方法引用那样可用,因为你想用以分类的条件可能比简单的属性访问器要复杂。例如,你可能想把热量不到400卡路里的菜划分为“低热量”(diet),热量400到700卡路里的菜划为“普通”(normal),高于700卡路里的划为“高热量”(fat)。由于pish类的作者没有把这个操作写成一个方法,你无法使用方法引用,但你可以把这个逻辑写成Lambda表达式:

public enum CaloricLevel(DIET,NORMAL,FAT
Map<CaloricLevel,List<Dish>> dishesByCaloricLevel = menu.stream().collect (groupingBy(dish>if (dish.getCalories()<= 400)return CaloricLevel.DIET;else if (dish.getCalories()<= 700)return
CaloricLeve1.NORMAL:
else returnaricevel.FT:

现在,你已经看到了如何对菜单中的菜看按照类型和热量进行分组,但要是想同时按照这两个标准分类怎么办呢?分组的强大之处就在于它可以有效地组合。让我们来看看怎么做。

6.4 分区
分区是分组的特殊情况:由一个谓词(返回一个布尔值的函数)作为分类函数,它称分区函数。分区函数返回一个布尔值,这意味着得到的分组Map的键类型是Boolean,于是它最多可以分为两组--true是一组,false是一组。例如,如果你是素食者或是请了一位素食的朋友来共进晚餐,可能会想要把菜单按照素食和非素食分开:
分区函数

Map<Boolean,List<Dish>> partitionedMenumenu.stream().collect(partitioningBy(Dish::isVegetarian));

这会返回下面的Map:

false=lpork,beef,chicken,prawns,salmon]true=lfrench fries,rice,season fruit,pizza]}

那么通过Map中键为true的值,就可以找出所有的素食菜看了
List<Dish> vegetarianDishes = partitionedMenu.get(true);
请注意,用同样的分区谓词,对菜单ist创建的流作筛选,然后把结果收集到另外一个List中也可以获得相同的结果:

List<Dish> vegetarianDishes=
menu.stream().filter(Dish::isVegetarian).collect (toList());

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/390505.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[office] Excel设置打印表头 #学习方法#学习方法#微信

Excel设置打印表头 有时候需要在每页上都显示表头&#xff0c;这样好查看数据&#xff0c;下面我们来看一个练习; 1、启动Excel 1)点击“开始-所有程序-Microsoft-Microsoft Office Excel 2003"; 2)出现一个满是格子的空白窗口&#xff0c;这就是一张电子表格了&#x…

Simulink模块说明

Simulink库 Commonly Used Blocks Bus Creator 将一组输入元素合并成一条总线**输入&#xff1a;**要包含在总线中的输入元素。**输出&#xff1a;**由合并的输入元素组成的输出总线&#xff0c;指定为虚拟或非虚拟总线。 Bus Selector Bus Selector 模块输出您从输入总线选…

CTFshow web(文件上传158-161)

web158 知识点&#xff1a; auto_append_file 是 PHP 配置选项之一&#xff0c;在 PHP 脚本执行结束后自动追加执行指定的文件。 当 auto_append_file 配置被设置为一个文件路径时&#xff0c;PHP 将在执行完脚本文件的所有代码后&#xff0c;自动加载并执行指定的文件。 这…

物流快递管理系统

文章目录 物流快递管理系统一、系统演示二、项目介绍三、13000字论文参考四、系统部分页面展示五、部分代码展示六、底部获取项目源码和万字论文参考&#xff08;9.9&#xffe5;带走&#xff09; 物流快递管理系统 一、系统演示 校园物流快递管理系统 二、项目介绍 主要技术…

2024.2.16日总结(小程序开发8)

数据监听器 监听对象属性的变化 数据监听器支持监听对象中单个或多个属性的变化 纯数据字段 什么是纯数据字段 纯数据字段指的是哪些不用于页面渲染的data字段 应用场景:例如有些情况下&#xff0c;某些 data 中的字段既不会展示在界面上&#xff0c;也不会传递给其他组件…

【每日一题】06 排序链表

问题描述 给你链表的头结点 head &#xff0c;请将其按 升序 排列并返回 排序后的链表 。 求解 /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/ struct ListNode* sortList(struct ListNode* head) {struct…

SpringBoot RabbitMQ收发消息、配置及原理

今天分析SpringBoot通过自动配置集成RabbitMQ的原理以及使用。 AMQP概念 RabbitMQ是基于AMQP协议的message broker&#xff0c;所以我们首先要对AMQP做一个简单的了解。 AMQP (Advanced Message Queuing Protocol) is a messaging protocol that enables conforming client a…

476. Number Complement(数字的补数)

问题描述 对整数的二进制表示取反&#xff08;0 变 1 &#xff0c;1 变 0&#xff09;后&#xff0c;再转换为十进制表示&#xff0c;可以得到这个整数的补数。 例如&#xff0c;整数 5 的二进制表示是 “101” &#xff0c;取反后得到 “010” &#xff0c;再转回十进制表示…

JavaSE-03笔记【继承~super】

文章目录 1. 继承1.1 继承概述&#xff08;理解&#xff09;1.2 如何继承&#xff08;掌握&#xff09;1.2.1 继承的语法格式1.2.2 具体举例 1.3 继承的相关特性&#xff08;掌握&#xff09;1.4 对继承自Object类的方法的测试&#xff08;理解&#xff09;1.5 难点解惑1.5.1 掌…

07-k8s中secret资源02-玩转secret

一、回顾secret资源的简单实用 第一步&#xff1a;将想要的数据信息【key&#xff1a;value】中的value值&#xff0c;使用base64编码后&#xff0c;写入secret资源清单中&#xff1b; 第二步&#xff1a;创建secret资源&#xff1b; 第三步&#xff1a;pod资源引用secret资源&…

【Linux网络编程六】服务器守护进程化Daemon

【Linux网络编程六】服务器守护进程化Daemon 一.背景知识&#xff1a;前台与后台二.相关操作三.Linux的进程间关系四.自成会话五.守护进程四步骤六.服务器守护进程化 一.背景知识&#xff1a;前台与后台 核心知识就是一个用户在启动Linux时&#xff0c;都会给一个session会话&a…

最小生成树(Kruskal算法及相关例题)

1.Kruskal算法概念以及基本思路 &#xff08;1&#xff09;概念&#xff1a; 克鲁斯卡尔算法是求连通网的最小生成树的另一种方法。它的时间复杂度为O&#xff08;ElogE&#xff09;(E是图G的边的总数)&#xff0c;适合于求边稀疏的网的最小生成树 。 其基本思想是&#xff…

JDBC访问数据库

目录 加载Driver驱动配置驱动地址 获取数据库连接创建会话-SQL命令发送器通过Statement发送SQL命令并得到结果处理结果关闭数据库资源测试 加载Driver驱动 1.在模块JDBC中新建一个lib目录文件 2. 将mysql-connector-j-8.2.0包粘贴至lib目录中。 配置驱动地址 // 加载…

Nvidia 携手 RTX 推出的本地运行 AI 聊天机器人

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

人工智能学习与实训笔记(三):神经网络之目标检测问题

目录 五、目标检测问题 5.1 目标检测基础概念 5.1.1 边界框&#xff08;bounding box&#xff09; 5.1.2 锚框&#xff08;Anchor box&#xff09; 5.1.3 交并比 5.2 单阶段目标检测模型YOLOv3 5.2.1 YOLOv3模型设计思想 5.2.2 YOLOv3模型训练过程 5.2.3 如何建立输出…

uni-app 经验分享,从入门到离职(二)—— tabBar 底部导航栏实战基础篇

文章目录 &#x1f4cb;前言⏬关于专栏 &#x1f3af;关于小程序 tabbar 的一些知识&#x1f3af;创建一个基本的 tabBar&#x1f4dd;最后 &#x1f4cb;前言 这篇文章的内容主题是关于小程序的 tabBar 底部导航栏的入门使用和实战技巧。通过上一篇文章的基础&#xff0c;我们…

【sgCreateTableColumn】自定义小工具:敏捷开发→自动化生成表格列html代码(表格列生成工具)[基于el-table-column]

源码 <template><!-- 前往https://blog.csdn.net/qq_37860634/article/details/136126479 查看使用说明 --><div :class"$options.name"><div class"sg-head">表格列生成工具</div><div class"sg-container"…

C++,stl,常用排序算法,常用拷贝和替换算法

目录 1.常用排序算法 sort random_shuffle merge reverse 2.常用拷贝和替换算法 copy replace replace_if swap 1.常用排序算法 sort 默认从小到大排序 #include<bits/stdc.h> using namespace std;int main() {vector<int> v;v.push_back(1);v.push_ba…

RabbitMQ如何保证可靠

0. RabbitMQ不可靠原因 消息从生产者到消费者的每一步都可能导致消息丢失&#xff1a; 发送消息时丢失&#xff1a; 生产者发送消息时连接MQ失败生产者发送消息到达MQ后未找到Exchange生产者发送消息到达MQ的Exchange后&#xff0c;未找到合适的Queue消息到达MQ后&#xff0c;…

idea里微服务依赖在maven能install但不能启动

场景&#xff1a;多个微服务相互依赖&#xff0c;install都没问题&#xff0c;jar包都是正常的&#xff0c;就连jar都能启动&#xff0c;为什么在idea里面项目就是不能启动呢&#xff0c;我是懵逼的 所以解决办法就是&#xff1a; 在设置的编译器里面虚拟机选项添加 -Djps.tr…