项目优化(异步化)

项目优化(异步化)

1. 认识异步化

1.1 同步与异步

  • 同步:一件事情做完,再做另外一件事情,不能同时进行其他的任务。
  • 异步:不用等一件事故完,就可以做另外一件事情。等第一件事完成时,可以收到一个通知,通知你这件事做好了,你可以再进行后续处理。

1.2 标准异步化的业务流程 ⭐

  1. 当用户要进行耗时很长的操作时,如点击提交后,不需要在界面长时间的等待,而是应该把这个任务保存到数据库中记录下来

  2. 用户要执行新任务时:

    1. 任务提交成功:

      • 程序还有多余的空闲线程时,可以立刻去执行这个任务。

      • 程序的线程都在繁忙时,无法继续处理,那就放到等待队列里。

    2. 任务提交失败:比如程序所有线程都在忙,任务队列满了

      • 拒绝掉这个任务,再也不去执行。

      • 通过保存到数据库中的记录来看到提交失败的任务,并且在程序空闲的时候,可以把任务从数据库中回调到程序里,再次去执行此任务。3

  3. 程序(线程)从任务队列中取出任务依次执行,每完成一件事情要修改一下的任务的状态。

  4. 用户可以查询任务的执行状态,或者在任务执行成功或失败时能得到通知(发邮件、系统消息提示、短信),从而优化体验。

  5. 如果我们要执行的任务非常复杂,包含很多环节,在每一个小任务完成时,要在程序(数据库中)记录一下任务的执行状态(进度)。

2. 线程池

  1. 线程池是什么:线程池是一种并发编程技术,用于优化多线程应用程序的性能和稳定性。它可以在应用程序启动时创建一组可重用的线程,并将工作任务分配给这些线程,以避免重复地创建和销毁线程,从而提高应用程序的吞吐量、响应时间和资源利用率。

  2. 线程池优点:

    1. 减少了线程的创建和销毁开销,提高了性能和效率。

    2. 避免了线程数量过多而导致的系统资源耗尽和线程调度开销增大的问题。

    3. 允许调整线程池大小,以满足不同应用程序的需求。

    4. 可以提高代码的可维护性和可重用性,避免了线程相关的错误,使得代码更加健壮和可靠。

  3. 线程池的作用 :帮助你轻松管理线程、协调任务的执行过程

  4. 线程池的实现:(不用自己写)

    1. 如果是在Spring中,可以用ThreadPoolTaskExecutor配合@Async注解来实现。(不太建议:进行了封装)

    2. JUC线程池的实现方式(JUC并发编程包,中的ThreadPoolExecutor来实现非常灵活地自定义线程池。)

      1. 创建配置线程池类

        /**
         * 配置线程池类
         * 可以在yml文件中写配置,实现自动注入
         */
        @Configuration
        public class ThreadPoolExecutorConfig {
        
            /**
             * 线程池的实现类
             * @return
             */
            @Bean
            public ThreadPoolExecutor threadPoolExecutor(){
                ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor();
                return threadPoolExecutor;
            }
        }
        
      2. 参数解释

        参数根据实际场景,测试调整,不断优化

        根据BI系统来说,线程数量要配置AI的能力(AI能力是瓶颈),ai支持4个线程,允许20个任务排队(参数根据条件调整)

        资源隔离策略:不同的程度的任务,分为不同的队列,比如VIP一个队列,普通用户一个队列。

        public ThreadPoolExecutor(int corePoolSize,//核心线程数:正常情况下,系统能同时工作的数量,处于随时就绪的状态
                                      int maximumPoolSize,//最大线程数,极限情况下,线程池有多少个线程
                                      long keepAliveTime,//空闲线程存活时间,非核心线程在没有任务的情况下多久删除,从而释放线程资源
                                      TimeUnit unit,//空闲线程存活时间单位
                                      BlockingQueue<Runnable> 															workQueue, //工作队列,用于存放给线程执行的任务,存在队列最大长度(一定要设置不可以为无限)
                                ThreadFactory threadFactory,//线程工厂,控制每个线程的生产
                                      RejectedExecutionHandler handler//(拒绝策略)线程池拒绝策略,==任务队列满的时候,我们采取什么措施,比如抛异常、不抛异常、自定义策略==。
                                 ) {
            
        }
        
        1. 线程池的工作机制

          1. 开始时:没有任务的线程,也没有任何的任务。
          1. 刚开始的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 0 ;maximumPoolSize = 0 ,workQueue.size = 0

          在这里插入图片描述

          1. 来了第一个任务,发现我们的员工没有到达正式的员工人数,来了一个员工直接处理这个任务。
          1. 第一个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 1 ;maximumPoolSize = 1 ,workQueue.size = 0

          在这里插入图片描述

          1. 又来了一个任务,发现我们的员工还没有达到正式员工数,再来一个员工直接处理这个任务。

          3、第二个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 2 ;maximumPoolSize = 2 ,workQueue.size = 0

          (一个人处理一个任务,一线程一任务)

          在这里插入图片描述

          1. 又来了一个任务,但是我们正式员工数已经满了(当前线程数 = corePoolSize = 2),将最新来的任务放到任务队列(最大长度 workQueue.size 是 2) 里等待,而不是再加新员工。

          4、第三、四个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 2 ;maximumPoolSize = 2 ,workQueue.size = 2

          (一个人处理一个任务,一线程一任务)

          在这里插入图片描述

          1. 又来了一个任务,但是我们的任务队列已经满了(当前线程数 大于了 corePoolSize=2,己有任务数 = 最大长度 workQueue.size = 2),新增线程(maximumPoolSize = 4)来处理任务,而不是丢弃任务。
          1. 第五个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 2 ;maximumPoolSize = 3 ,workQueue.size = 2

          (找了一个临时工处理这个队新来的这个任务)

          在这里插入图片描述

          1. 当到了任务7,但是我们的任务队列已经满了、临时工也招满了(当前线程数 = maximumPoolSize = 4,已有任务数 = 最大长度 workQueue.size = 2) 调用RejectedExecutionHandler 拒绝策略来处理多余的任务。
          1. 等到第六个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 2 ;maximumPoolSize = 4 ,workQueue.size = 2

          (再找了一个临时工处理这个队列任务中最前面的任务4,然后这个第六个新来的线程就进入到任务队列中等待)

          1. 等到第七个任务到来时的核心线程数、最大线程数、任务队列中分别存在的数量为:

          corePoolSize = 2 ;maximumPoolSize = 4 ,workQueue.size = 2

          (此时在核心线程数、最大线程数以及任务队列中都占满了,以及无法接收新的任务了,所以说只能拒绝任务7)

          7、最后,如果当前线程数超过 corePoolSize (正式员工数),又没有新的任务给他,那么等 keepAliveTime 时间达到后,就可以把这个线程释放。

        2. 确定线程池的参数

          1. corePoolSize(核心线程数=>正式员工数):正常情况下,可以设置为 2 - 4
          2. maximumPoolSize(最大线程数):设置为极限情况,设置为 <= 4
          3. keepAliveTime(空闲线程存活时间):一般设置为秒级或者分钟级
          4. TimeUnit unit(空闲线程存活时间的单位):分钟、秒
          5. workQueue(工作队列):结合实际请况去设置,可以设置为20 (2n+1)
          6. threadFactory(线程工厂):控制每个线程的生成、线程的属性(比如线程名)
          7. RejectedExecutionHandler(拒绝策略):抛异常,标记数据库的任务状态为 “任务满了已拒绝”
        3. 线程设置种类

          • IO密集型:耗费带宽/内存/硬盘的读写资源,corePoolSize可以设置大一点,一般经验值是 2n 左右,但是建议以 IO 的能力为主。
          • 计算密集型:耗费cpu资源,比如音视频资源,图像处理、数学计算等一般是设置corePoolSize为cpu的核数+1(空余线程池)

          考虑导入百万数据到数据库,属于IO密集型任务、还是计算密集型任务?

          答:考虑导入百万数据到数据库是一个IO密集型任务。导入数据需要从外部读取大量数据,然后将其写入数据库,这个过程中计算的工作量不是很高,相对来说需要更多的磁盘IO和网络IO。因此,这个任务的性能瓶颈通常是在IO操作上,而非计算上。

        4. 自定义线程池

          /**
           * 配置线程池类
           * 可以在yml文件中写配置,实现自动注入
           */
          @Configuration
          public class ThreadPoolExecutorConfig {
          
              @Bean
              public ThreadPoolExecutor threadPoolExecutor() {
                  ThreadFactory threadFactory = new ThreadFactory() {
                      private int count = 1;
          
                      @Override
                      public Thread newThread(@NotNull Runnable r) {
                          // 一定要将这个 r 放入到线程当中
                          Thread thread = new Thread(r);
                          thread.setName("线程:" + count);
                          // 任务++
                          count++;
                          return thread;
                      }
                  };
                  ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(2, 4, 100, TimeUnit.SECONDS,
                          new ArrayBlockingQueue<>(100), threadFactory);
                  return threadPoolExecutor;
              }
          }
          
        5. 提交任务到自定义线程池

          @RestController
          @RequestMapping("/queue")
          @Slf4j
          @Profile({ "dev", "local" })
          @Api(tags = "QueueController")
          @CrossOrigin(origins = "http://localhost:8000", allowCredentials = "true")
          public class QueueController {
          
              @Resource
              private ThreadPoolExecutor threadPoolExecutor;
          
              @GetMapping("/add")
              public void add(String name) {
                  CompletableFuture.runAsync(() -> {
                      log.info("任务执行中:" + name + ",执行人:" + Thread.currentThread().getName());
                      try {
                          Thread.sleep(60000);
                      } catch (InterruptedException e) {
                          throw new RuntimeException(e);
                      }
                  },threadPoolExecutor);
              }
          
              @GetMapping("/get")
              public String get() {
                  Map<String, Object> map = new HashMap<>();
                  int size = threadPoolExecutor.getQueue().size();
                  map.put("队列长度:", size);
                  long taskCount = threadPoolExecutor.getTaskCount();
                  map.put("任务总数:", taskCount);
                  long completedTaskCount = threadPoolExecutor.getCompletedTaskCount();
                  map.put("已完成任务数:", completedTaskCount);
                  int activeCount = threadPoolExecutor.getActiveCount();
                  map.put("正在工作的线程数:", activeCount);
                  return JSONUtil.toJsonStr(map);
              }
          }
          

3. 实操项目使用异步化优化

  1. 系统问题分析:

    1. 用户等待时间较长
    2. 业务服务器可能会有很多请求在处理,导致系统资源紧张,严重时导致服务器宕机或者无法处理新的请求(很多用户在系统中进行同一个请求导致系统使用体验降低。)
    3. 调用的第三方服务(如AI能力)的处理能力是有限的,比如每3秒只处理1个请求,当多个请求时会导致 AI 处理不过来,严重时AI可能会对后台系统拒绝服务。
  2. 解决方法=>异步化

    • 异步化使用场景:调用的服务处理能力有限,或者接口的处理(返回)时间较长,考虑异步化
  3. 异步化优化前后对比

    • 优化前架构图

      在这里插入图片描述

    • 优化后架构图

      在这里插入图片描述

  4. 异步化(new Rhread)实现

    1. 任务队列的最大容量应该设置多少合适?
    2. 程序怎么从任务队列中取出任务去执行,这个任务队列的流程怎么实现的,怎么保证程序最多同时执行多少个任务?
      • 阻塞队列
      • 线程池
      • 增加更多的人手?
    1. 流程梳理:

      1. 给chart表新增任务状态字段(比如排队中、执行中、已完成、失败),任务执行信息字段(用于记录任务执行中、或者失败的一些信息)

        -- 图表信息表
        create table if not exists chart
        (
            id          bigint auto_increment comment 'id' primary key,
            goal        text                                   null comment '分析目标',
            chartName   varchar(256)                           null comment '图表名称',
            chartData   text                                   null comment '图表数据',
            chartType   varchar(256)                           null comment '图表类型',
            genChart    text                                   null comment '生成的图表信息',
            genResult   text                                   nul l comment '生成的分析结论',
            chartStatus varchar(128) default 'wait'            not null comment 'wait-等待,running-生成中,succeed-成功生成,failed-生成失败',
            execMessage text                                   null comment '执行信息',
            userId      bigint                                 null comment '创建图标用户 id',
            createTime  datetime     default CURRENT_TIMESTAMP not null comment '创建时间',
            updateTime  datetime     default CURRENT_TIMESTAMP not null on update CURRENT_TIMESTAMP comment '更新时间',
            isDelete    tinyint      default 0                 not null comment '是否删除'
        ) comment '图表信息表' collate = utf8mb4_unicode_ci;
        
      2. 用户点击智能分析页面的提交按钮时,先把图表立刻保存到数据库中(作为一个任务)

      3. 任务:先修改图表任务状态为"执行中"。等执行成功后,修改为"已完成"、保存执行结果;执行失败后,状态修改为"失败",记录任务失败信息。

      4. 用户可以在图表管理界面插查看所有的图表的信息和状态

        • 已生成的
        • 生成中的
        • 生成失败的
      5. 用户可以修改生成失败的图表信息,点击重新生成图表

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/230084.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

处理哈希冲突的常见方法(五种)

1、开放地址法&#xff08;Open Addressing&#xff09;&#xff1a; 线性探测&#xff08;Linear Probing&#xff09;&#xff1a; 当发生冲突时&#xff0c;顺序地查找下一个可用的槽位&#xff0c;直到找到空槽或者整个表被搜索一遍。这个方法的缺点是可能出现“聚簇”&am…

webpack该如何打包

1.我们先创建一个空的大文件夹 2.打开该文件夹的终端 输入npm init -y 2.1.打开该文件夹的终端 2.2在该终端运行 npm init -y 3.安装webpack 3.1打开webpack网址 点击“中文文档” 3.2点击“指南”在点击“起步” 3.3复制基本安装图片画线的代码 4.在一开始的文件夹下在创建一…

【性能测试】Jmeter 配置元件(一):计数器

Jmeter 配置元件&#xff08;一&#xff09;&#xff1a;计数器 在 Jmeter 中&#xff0c;通过函数 ${__counter(,)} 可以实现每次加 1 1 1 的计数效果。但如果步长不为 1 1 1&#xff0c;则要利用到我们的计数器。 函数作用${__counter(,)}计数器&#xff0c;每次加 1${__d…

int 和 Integer 有什么区别,还有 Integer 缓存的实现

✨前言✨   Java本文主要介绍Java int 和 Integer的区别以及Integer 缓存的实现 &#x1f352;欢迎点赞 &#x1f44d; 收藏 ⭐留言评论 &#x1f4dd;私信必回哟&#x1f601; &#x1f352;博主将持续更新学习记录收获&#xff0c;友友们有任何问题可以在评论区留言 文章目…

AI别墅设计

这两年我致力于研发别墅AI自动化设计&#xff0c;包括设计别墅各层的平面图以及导出三维效果图。目的是可以快速生成大量别墅的设计图和效果图让自建房用户可以第一时间挑选自己需要的房型并看到房屋建成后效果&#xff0c;大大提高建筑施工和设计人员的工作效率。 别墅设计包括…

记一次测试环境git翻车经历

本来想拉一个功能分支进行新的功能开发&#xff0c;合并代码发现没有冲突居然有文件被修改了&#xff0c;贸然选择最近的一次回滚提交&#xff0c;没想到不假思索的push -f 导致一部分dev主干的代码不见了。 事故记录 开发分支origin/dev&#xff0c;功能分支file 合并之后发…

pytorch-mask-rcnn 官方

This is a Pytorch implementation 实现 of Mask R-CNN that is in large parts based on Matterports Mask_RCNN. Matterports repository is an implementation on Keras and TensorFlow. The following parts of the README are excerpts 摘录 from the Matterport README. …

电子学会C/C++编程等级考试2021年09月(五级)真题解析

C/C++等级考试(1~8级)全部真题・点这里 第1题:抓牛 农夫知道一头牛的位置,想要抓住它。农夫和牛都位于数轴上,农夫起始位于点N(0<=N<=100000),牛位于点K(0<=K<=100000)。农夫有两种移动方式: 1、从X移动到X-1或X+1,每次移动花费一分钟 2、从X移动到2*X,每…

Gitlab+GitlabRunner搭建CICD自动化流水线将应用部署上Kubernetes

文章目录 安装Gitlab服务器准备安装版本安装依赖和暴露端口安装Gitlab修改Gitlab配置文件访问Gitlab 安装Gitlab Runner服务器准备安装版本安装依赖安装Gitlab Runner安装打包工具安装docker安装java17安装maven 注册Gitlab Runner 搭建自动化部署准备SpringBoot项目添加一个Co…

【力扣热题100】287. 寻找重复数(弗洛伊德的乌龟和兔子方法)

【力扣热题100】287. 寻找重复数 写在最前面理解解决 "寻找重复数" 问题的算法问题描述弗洛伊德的乌龟和兔子方法为什么这个方法有效&#xff1f; 代码复杂度 总结回顾 写在最前面 刷一道力扣热题100吧 难度中等 https://leetcode.cn/problems/find-the-duplicate-…

文献计量学方法与应用、主题确定、检索与数据采集、VOSviewer可视化绘图、Citespace可视化绘图、R语言文献计量学绘图分析

目录 一、文献计量学方法与应用简介 二、主题确定、检索与数据采集 三、VOSviewer可视化绘图 四、Citespace可视化绘图 五、R语言文献计量学绘图分析 六、论文写作 七、论文投稿 更多应用 文献计量学是指用数学和统计学的方法&#xff0c;定量地分析一切知识载体的交叉…

HarmonyOS鸿蒙操作系统架构开发

什么是HarmonyOS鸿蒙操作系统&#xff1f; HarmonyOS是华为公司开发的一种全场景分布式操作系统。它可以在各种智能设备&#xff08;如手机、电视、汽车、智能穿戴设备等&#xff09;上运行&#xff0c;具有高效、安全、低延迟等优势。 目录 HarmonyOS 一、HarmonyOS 与其他操…

用23种设计模式打造一个cocos creator的游戏框架----(十)迭代器模式

1、模式标准 模式名称&#xff1a;迭代器模式 模式分类&#xff1a;行为型 模式意图&#xff1a;提供一种方法顺序访问一个聚合对象中的各个元素&#xff0c;且不需要暴露该对象的内部表示. 结构图&#xff1a; ​ 适用于&#xff1a; 1、当你需要遍历一个复杂的数据结构…

24、文件上传漏洞——Apache文件解析漏洞

文章目录 一、环境简介一、Apache与php三种结合方法二、Apache解析文件的方法三、Apache解析php的方法四、漏洞原理五、修复方法 一、环境简介 Apache文件解析漏洞与用户配置有密切关系。严格来说&#xff0c;属于用户配置问题&#xff0c;这里使用ubantu的docker来复现漏洞&am…

概率测度理论方法(第 2 部分)

一、说明 欢迎回到这个三部曲的第二部分&#xff01;在第一部分中&#xff0c;我们为测度论概率奠定了基础。我们探索了测量和可测量空间的概念&#xff0c;并使用这些概念定义了概率空间。在本文中&#xff0c;我们使用测度论来理解随机变量。 作为一个小回顾&#xff0c;在第…

ardupilot开发 --- git 篇

一些概念 工作区&#xff1a;就是你在电脑里能看到的目录&#xff1b;暂存区&#xff1a;stage区 或 index区。存放在 &#xff1a;工作区 / .git / index 文件中&#xff1b;版本库&#xff1a;本地仓库&#xff0c;存放在 &#xff1a;工作区 / .git 中 关于 HEAD 是所有本地…

【js】js实现多个视频连续播放:

文章目录 一、效果&#xff1a;二、实现&#xff1a; 一、效果&#xff1a; 二、实现&#xff1a; <!DOCTYPE html> <html> <head><title>Video Player</title><style>#progressBar { width: 800px;height: 20px;background-color: #dd…

图空图床图片外链系统源码-支持自定义权限策略-图片大小格式

含视频搭建教程。 大致功能&#xff1a; 支持本地等多种第三方云储存 AWS S3、阿里云 OSS、腾讯云 COS、七牛云、又拍云、SFTP、FTP、WebDav、Minio多种数据库驱动支持&#xff0c;MySQL 5.7、PostgreSQL 9.6、SQLite 3.8.8、SQL Server 2017支持配置使用多种缓存驱动&#xff…

代立冬:基于Apache Doris+SeaTunnel 实现多源实时数据仓库解决方案探索实践

大家好&#xff0c;我是白鲸开源的联合创始人代立冬&#xff0c;同时担任 Apache DolphinScheduler 的 PMC chair 和 SeaTunnel 的 PMC。作为 Apache Foundation 的成员和孵化器导师&#xff0c;我积极参与推动多个开源项目的发展&#xff0c;帮助它们通过孵化器成长为 Apache …

Java编程中通用的正则表达式(一)

正则表达式&#xff08;Regular Expression&#xff0c;简称RegEx&#xff09;&#xff0c;又称常规表示法、正则表示、正规表示式、规则表达式、常式、表达式等&#xff0c;是计算机科学中的一个概念。正则表达式是用于描述某种特定模式的字符序列&#xff0c;特别是用来匹配、…