Java流操作解析:深度剖析中间操作、终端操作与并行处理机制

在这里插入图片描述

文章目录

    • 一、中间操作
      • 1.1 过滤(filter)
      • 1.2 映射(map)
      • 1.3 排序(sorted)
      • 1.4 去重(distinct)
    • 二、 终端操作
      • 2.1 收集(collect)
      • 2.2 计数(count)
      • 2.3 匹配(anyMatch)
    • 三、并行流
      • 3.1 流的并行处理机制
      • 3.2 多线程执行流操作的内部工作原理

一、中间操作

对于如何来到filter过滤操作的源码位置,读者可以参考我的上一篇博客哈,具体的步骤都已经详细给出。

1.1 过滤(filter)

在这里插入图片描述

主要作用:创建一个新的无状态操作,用于对流中的元素进行过滤。在处理流元素时,会根据传入的predicate条件进行过滤,并将满足条件的元素传递给下游。

在这里插入图片描述

1.2 映射(map)

map的作用:对流中的每个元素应用指定的映射函数,然后将映射后的结果组成一个新的流返回。

源码解析流程
在这里插入图片描述

主要作用:创建一个新的无状态操作,用于对流中的元素应用指定的映射函数,并将映射后的结果传递给下游的Sink对象。

在这里插入图片描述

1.3 排序(sorted)

sorted的作用:对流中的元素进行排序,排序方式由传入的比较器(Comparator)决定,排序后返回一个新的排序后的流。

源码解析流程

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

1.4 去重(distinct)

distinct的作用:去重操作会移除流中的重复元素,只保留其中的一个。

源码解析流程

在这里插入图片描述

在这里插入图片描述

由于代码过长,截图不方便,采用代码加注释的形式.实现 makeRef 方法,该方法创建了一个去重操作的流水线,使用了并行处理来实现去重,并且在处理过程中保持了有序性 。

static <T> ReferencePipeline<T, T> makeRef(AbstractPipeline<?, T, ?> upstream) {
    // 创建一个新的 StatefulOp 实例,表示去重操作的流水线,使用 REFERENCE 类型的流形状
    return new ReferencePipeline.StatefulOp<T, T>(upstream, StreamShape.REFERENCE,
                                                  StreamOpFlag.IS_DISTINCT | StreamOpFlag.NOT_SIZED) {

        // reduce 方法用于将并行处理的元素归约为单个结果
        <P_IN> Node<T> reduce(PipelineHelper<T> helper, Spliterator<P_IN> spliterator) {
            // 如果流是有序的,则保持排序顺序
            TerminalOp<T, LinkedHashSet<T>> reduceOp
                    = ReduceOps.<T, LinkedHashSet<T>>makeRef(LinkedHashSet::new, LinkedHashSet::add,
                                                             LinkedHashSet::addAll);
            // 使用 reduceOp 对元素进行归约操作,并将结果封装为 Node
            return Nodes.node(reduceOp.evaluateParallel(helper, spliterator));
        }

        // opEvaluateParallel 方法用于并行评估操作
        @Override
        <P_IN> Node<T> opEvaluateParallel(PipelineHelper<T> helper,
                                          Spliterator<P_IN> spliterator,
                                          IntFunction<T[]> generator) {
            // 如果流中已经包含了 DISTINCT 标志,表示已经进行了去重操作,则直接返回
            if (StreamOpFlag.DISTINCT.isKnown(helper.getStreamAndOpFlags())) {
                // 不进行任何操作,直接返回流的结果
                return helper.evaluate(spliterator, false, generator);
            }
            // 如果流中已经包含了 ORDERED 标志,表示流是有序的
            else if (StreamOpFlag.ORDERED.isKnown(helper.getStreamAndOpFlags())) {
                // 调用 reduce 方法进行归约操作
                return reduce(helper, spliterator);
            }
            // 如果流不是有序的
            else {
                // 用于标记是否有 null 值出现的原子布尔值
                AtomicBoolean seenNull = new AtomicBoolean(false);
                // 使用 ConcurrentHashMap 存储元素,保证线程安全
                ConcurrentHashMap<T, Boolean> map = new ConcurrentHashMap<>();
                // 使用 ForEachOps 进行并行遍历并添加元素到 ConcurrentHashMap
                TerminalOp<T, Void> forEachOp = ForEachOps.makeRef(t -> {
                    if (t == null)
                        seenNull.set(true);  // 如果元素为 null,则设置标志为 true
                    else
                        map.putIfAbsent(t, Boolean.TRUE);  // 如果元素不为 null,则添加到 ConcurrentHashMap 中
                }, false);
                forEachOp.evaluateParallel(helper, spliterator);

                // 如果出现 null 元素,则将其加入到结果中
                Set<T> keys = map.keySet();
                if (seenNull.get()) {
                    // 如果有 null 元素,则创建一个支持 null 元素的 HashSet 并添加到结果中
                    keys = new HashSet<>(keys);
                    keys.add(null);
                }
                // 返回包含去重结果的 Node
                return Nodes.node(keys);
            }
        }
    };
}

**ps:**本篇仅仅展示部分使用较多的中间操作,读者可自行去解读其它中间操作。

二、 终端操作

2.1 收集(collect)

collect方法行为:使用supplier创建结果容器,使用accumulator将流中的元素逐个添加到结果容器中,最后使用combiner将不同分区的结果容器合并成一个整体结果容器。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

collect方法的实现中,可能会涉及到工厂模式、建造者模式等,具体取决于你使用的收集器(Collector)。

Demo:当使用Collectors.toList()方法,会返回一个Collector,这里使用了工厂模式,Collectors.toList()方法返回了一个Collector的实例,这个实例使用了CollectorImpl类。

实现类似如下

/**
* ArrayList::new作为一个Supplier,以及List::add作为一个累加器函数,可以说是使用了工厂模式和策略模式
*/
public static <T> Collector<T, ?, List<T>> toList() {
    return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
                                (left, right) -> { left.addAll(right); return left; },
                                CH_ID);
}

2.2 计数(count)

作用:流中调用 count() 方法将返回流中元素的总数。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

可能涉及到设计模式思想

public long count() {
    return mapToLong(e -> 1L).sum();
}
  1. 装饰者模式:在 count() 方法的实现中,可以看到通过 mapToLong() 方法对流进行了装饰,将流中的每个元素映射为 1L,然后再调用 sum() 方法。这种装饰操作符合装饰者模式的思想,通过添加额外的功能来扩展原有对象的行为。
  2. 工厂模式:在流式编程中,流对象的创建通常是通过工厂方法来实现的。例如,Stream 接口中的 mapToLong() 方法就是一个工厂方法,用于创建一个新的 LongStream 对象。
  3. 策略模式mapToLong() 方法接受一个函数式接口 ToLongFunction 作为参数,这个函数式接口的具体实现是根据传入的 lambda 表达式来确定的,从而实现了策略模式的思想,即根据不同的需求传入不同的策略。

2.3 匹配(anyMatch)

作用: 用于判断流中是否存在至少一个元素满足给定的条件。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

内部实现中可能会涉及到的设计模式思想

  1. 迭代器模式:在流的内部实现中很可能会使用迭代器来遍历流中的元素,并在遍历过程中进行条件判断,以确定是否存在满足条件的元素。
  2. 策略模式anyMatch() 方法接受一个 Predicate 参数,这个参数是一个函数式接口,根据传入的 lambda 表达式或者方法引用来确定具体的判断条件,这符合策略模式的思想。
  3. 模板方法模式:流的内部可能会使用模板方法模式来定义流的处理流程,例如迭代、条件判断等,而具体的操作则由子类或者传入的参数决定。

三、并行流

3.1 流的并行处理机制

流的并行处理机制是 Java 中处理数据流的一种方式,它可以利用多核处理器和并行计算资源来加速数据处理过程。流的并行处理通过将数据流分成多个子流,并行处理每个子流来实现。

结合源码来解析一下流的并行处理机制

  1. 在流的并行处理中,流的元素会被分成多个子流,每个子流会被分配给不同的线程进行处理。这个过程由 sourceSpliterator(terminalOp.getOpFlags()) 方法完成,它返回一个适当的分隔器,用于将流的元素分割成多个子流。
  2. 根据流的并行性,调用不同的评估方法来处理子流:
    • 如果流是并行的(即 isParallel() 返回 true),则调用 terminalOp.evaluateParallel(this, sourceSpliterator(terminalOp.getOpFlags())) 方法来并行评估子流。这个方法会利用并行计算资源来同时处理多个子流,加速数据处理过程。
    • 如果流是顺序的(即 isParallel() 返回 false),则调用 terminalOp.evaluateSequential(this, sourceSpliterator(terminalOp.getOpFlags())) 方法来顺序评估子流。这个方法会按顺序处理每个子流的元素,没有并行化处理。
  3. 在评估方法中,会根据 TerminalOp 的实现对子流的元素进行相应的操作,并最终返回结果。

3.2 多线程执行流操作的内部工作原理

多线程执行流操作的内部工作原理可以通过分析 Java 流框架的实现来理解。流框架在处理流操作时,会根据流的并行性将任务分配给多个线程执行,并利用并发编程的技术来实现高效的多线程执行。

结合源码来解析一下多线程执行流操作的内部工作原理

  1. 分割流的元素:在流的并行处理中,流的元素会被分成多个子流,每个子流会被分配给不同的线程进行处理。这个过程由 sourceSpliterator(terminalOp.getOpFlags()) 方法完成,它返回一个适当的分隔器,用于将流的元素分割成多个子流。
  2. 并行执行任务:根据流的并行性,Java 流框架会将任务分配给线程池中的多个线程执行,并行处理每个子流。在源码中,调用了 terminalOp.evaluateParallel(this, sourceSpliterator(terminalOp.getOpFlags())) 方法来并行评估子流。这个方法会利用并行计算资源来同时处理多个子流,加速数据处理过程。
  3. 任务的合并与结果返回:在并行执行过程中,各个线程会独立执行任务,并产生各自的部分结果。在评估方法的内部,Java 流框架会负责合并各个线程的结果,并最终返回整体的结果。这样,多线程执行的结果会被正确地合并到最终的结果中。
  4. 线程管理与调度:Java 流框架会利用线程池来管理并发执行的线程,确保资源的有效利用和任务的合理调度。线程池会根据需要动态地管理线程的数量,并根据系统资源和任务负载来调度线程的执行。

如今我努力奔跑,不过是为了追上那个曾经被你寄予厚望的我

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/519808.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

leetcode热题100.跳跃游戏2

Problem: 45. 跳跃游戏 II 文章目录 题目思路复杂度Code 题目 给定一个长度为 n 的 0 索引整数数组 nums。初始位置为 nums[0]。 每个元素 nums[i] 表示从索引 i 向前跳转的最大长度。换句话说&#xff0c;如果你在 nums[i] 处&#xff0c;你可以跳转到任意 nums[i j] 处: …

leetcode.24. 两两交换链表中的节点

题目 给定一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后的链表。 你不能只是单纯的改变节点内部的值&#xff0c;而是需要实际的进行节点交换。 思路 创建虚拟头节点&#xff0c;画图&#xff0c;确认步骤。 实现 /*** Definition for singly-li…

C++运算符重载如何模拟数学表达式,或模拟Python sympy和numpy

在人工智能数学基础一书中&#xff0c;下面是一题Python求函数极限的例子&#xff1a; 【例2.6】使用Python编程求 lim( x → 1) (x^2 - 1 / x - 1) ————————————————————————————————————————— import sympy from sympy import oo…

详细剖析多线程3----代码案例分析

文章目录 一、单例模式(校招中最常考的设计模式之⼀)1.1饿汉模式1.2懒汉模式 二、阻塞队列三、定时器四、线程池五、总结 一、单例模式(校招中最常考的设计模式之⼀) 单例模式是一种设计模式&#xff0c;其核心思想是保证一个类只有一个实例&#xff0c;并提供一个全局访问点来…

Three.js阴影贴图

生成阴影贴图的步骤如下&#xff1a; 从光位置视点&#xff08;阴影相机&#xff09;创建深度图。从相机的角度进行屏幕渲染在每个像素点&#xff0c;将阴影相机的MVP矩阵计算出的深度值与深度图值进行比较如果深度图值较低&#xff0c;则说明该像素点存在阴影 &#xff0c;因…

html5如何在使用原生开发的情况下实现组件化

我们知道如何在vue/react中使用组件化开发&#xff0c;那么如果只是一个简单的界面&#xff0c;一个HTML就搞定的事情&#xff0c;你还会去新建一个vue/react项目吗&#xff1f; 在使用原生HTML开发时&#xff0c;我们也会遇到一些常见的功能、模块&#xff0c;那么如何在原生…

【APUE】网络socket编程温度采集智能存储与上报项目技术------多路复用

作者简介&#xff1a; 一个平凡而乐于分享的小比特&#xff0c;中南民族大学通信工程专业研究生在读&#xff0c;研究方向无线联邦学习 擅长领域&#xff1a;驱动开发&#xff0c;嵌入式软件开发&#xff0c;BSP开发 作者主页&#xff1a;一个平凡而乐于分享的小比特的个人主页…

无锡国家集成电路设计中心某公司的单锂小电机直流电机H桥驱动电路

H桥驱动 L9110S是一款直流电机驱动电路&#xff0c;适合单节锂电池应用。输出电流0.4A。价格约3毛。 推荐原因&#xff1a; 某些人应该知道这个地方&#xff0c;大多数人应该不知道这个地方&#xff0c;所以推荐一下。 这个地方去过几次&#xff0c;某公司与某方走的“近”&…

在同一个局域网如何共享打印机和文件

1.在连接了打印机的主机上设置 1.1启用windows共享 打开网络与共享中心&#xff0c;点击“更改高级共享设置” 选择&#xff1a; “启用网络发现”“启用文件和打印机共享”“启用共享以便可以访问网络的用户可以读取和写入公用文件夹中的文件” 打开控制面板&#xff0c;选…

C#将Console写至文件,且文件固定最大长度

参考文章 将C#的Console.Write同步到控制台和log文件输出 业务需求 在生产环境中&#xff0c;控制台窗口不便展示出来。 为了在生产环境中&#xff0c;完整记录控制台应用的输出&#xff0c;选择将其输出到文件中。 但是&#xff0c;一次性存储所有输出的话&#xff0c;文件会…

NASA数据集——加拿大西北地区(NWT)2014 年被野火烧毁的北方森林的实地数据

ABoVE: Characterization of Carbon Dynamics in Burned Forest Plots, NWT, Canada, 2014 简介 文件修订日期&#xff1a;2019-04-12 数据集版本: 1 摘要 该数据集提供了加拿大西北地区&#xff08;NWT&#xff09;2014 年被野火烧毁的北方森林的实地数据。在 2015 年的实…

(学习日记)2024.04.03:UCOSIII第三十一节:信号量函数接口讲解

写在前面&#xff1a; 由于时间的不足与学习的碎片化&#xff0c;写博客变得有些奢侈。 但是对于记录学习&#xff08;忘了以后能快速复习&#xff09;的渴望一天天变得强烈。 既然如此 不如以天为单位&#xff0c;以时间为顺序&#xff0c;仅仅将博客当做一个知识学习的目录&a…

Linux (Ubuntu)- mysql8 部署

目录 1.基本部署 2.修改密码 3.开启root可远程连接配置 1.基本部署 01》》先查看OS类型&#xff0c;如果是Ubuntu在往下边看 rootspray:/etc/mysql/mysql.conf.d# lsb_release -a LSB Version: core-11.1.0ubuntu2-noarch:security-11.1.0ubuntu2-noarch Distributor ID: …

12-1-CSS 常用样式属性

个人主页&#xff1a;学习前端的小z 个人专栏&#xff1a;HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结&#xff0c;欢迎大家在评论区交流讨论&#xff01; 文章目录 CSS 常用样式属性1 CSS 三角形2 CSS 用户界面样式2.1 什么是界面样式2.2 鼠标…

【Spring】AOP——使用@around实现面向切面的方法增强

工作业务中&#xff0c;有大量分布式加锁的重复代码&#xff0c;存在两个问题&#xff0c;一是代码重复率高&#xff0c;二是容易产生霰弹式修改&#xff0c;使用注解和AOP可以实现代码复用&#xff0c;简化分布式锁加锁和解锁流程。 around注解是AspectJ框架提供的&#xff0c…

RK3568测试

作者简介&#xff1a; 一个平凡而乐于分享的小比特&#xff0c;中南民族大学通信工程专业研究生在读&#xff0c;研究方向无线联邦学习 擅长领域&#xff1a;驱动开发&#xff0c;嵌入式软件开发&#xff0c;BSP开发 作者主页&#xff1a;一个平凡而乐于分享的小比特的个人主页…

Prometheus+grafana环境搭建Docker服务(docker+二进制两种方式安装)(八)

由于所有组件写一篇幅过长&#xff0c;所以每个组件分一篇方便查看&#xff0c;前七篇链接如下 Prometheusgrafana环境搭建方法及流程两种方式(docker和源码包)(一)-CSDN博客 Prometheusgrafana环境搭建rabbitmq(docker二进制两种方式安装)(二)-CSDN博客 Prometheusgrafana环…

java数据结构与算法刷题-----LeetCode172. 阶乘后的零

java数据结构与算法刷题目录&#xff08;剑指Offer、LeetCode、ACM&#xff09;-----主目录-----持续更新(进不去说明我没写完)&#xff1a;https://blog.csdn.net/grd_java/article/details/123063846 文章目录 数学&#xff1a;阶乘的10因子个数数学优化:思路转变为求5的倍数…

【蓝桥杯选拔赛真题57】C++字符串反转 第十四届蓝桥杯青少年创意编程大赛 算法思维 C++编程选拔赛真题解

目录 C字符串反转 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 七、推荐资料 C字符串反转 第十四届蓝桥杯青少年创意编程大赛C选拔赛真题 一、题目要求 1、编程实现 给定一个只包含大写字母"M…

C++进阶--C++11(2)

C11第一篇 C11是C编程语言的一个版本&#xff0c;于2011年发布。C11引入了许多新特性&#xff0c;为C语言提供了更强大和更现代化的编程能力。 可变参数模板 在C11中&#xff0c;可变参数模板可以定义接受任意数量和类型参数的函数模板或类模板。它可以表示0到任意个数&…