Spring Boot 中为什么 需要限流、降级和熔断?

为什么 Spring Boot 需要限流、降级和熔断?

在一个分布式系统,特别是使用 Spring Boot 微服务构建的系统中,应用程序很可能面临各种与流量、依赖故障和资源限制相关的挑战。如果没有适当的保护措施,这些挑战可能导致:

  1. 系统过载和级联故障:

    • 问题: 突发的流量激增(无论是合法的还是恶意的),或者性能不佳的上游服务,都可能使你的应用程序不堪重负。如果一个服务变得缓慢或无响应,可能会导致线程堆积,消耗资源(如 CPU、内存、数据库连接),并最终导致应用程序崩溃。
    • 级联效应: 在微服务架构中,服务通常相互依赖。如果一个服务因过载而发生故障,可能会触发依赖于它的其他服务的故障,从而在整个系统中产生多米诺骨牌效应。这就是所谓的级联故障。
  2. 资源耗尽:

    • 问题: 不受控制的流量或低效的代码可能导致关键资源迅速耗尽,例如:
      • 线程池: 过多的并发请求会耗尽可用的线程,导致请求排队和响应时间缓慢。
      • 数据库连接: 过多的请求会耗尽数据库连接池,导致数据库性能下降和潜在的故障。
      • 内存: 处理大量请求或处理低效操作可能会导致内存泄漏或过度内存使用,从而导致 OutOfMemoryError 错误。
      • CPU: 高请求率和复杂的处理会使 CPU 资源饱和,导致应用程序无响应。
    • 后果: 资源耗尽会导致性能下降、应用程序不稳定以及潜在的服务中断。
  3. 依赖故障:

    • 问题: 微服务架构依赖于与其他服务(数据库、外部 API、其他微服务)的通信。这些依赖关系可能会因网络问题、服务中断或依赖服务自身的性能问题而失败。
    • 影响: 如果你的应用程序不能优雅地处理依赖故障,它可能会被阻塞,等待无响应的服务,导致响应缓慢以及自身服务内的资源耗尽。这再次导致级联故障。
  4. 缓慢或不稳定的上游服务:

    • 问题: 即使依赖项没有完全失败,也可能在高负载或由于自身内部问题而变得缓慢或不稳定。
    • 影响: 你的应用程序,等待来自上游服务的缓慢响应,也会变得缓慢且无响应。这会降低用户体验,并且仍然可能导致资源耗尽,因为请求会排队等待响应。

为了减轻这些风险并构建弹性的应用程序,我们采用了限流、降级和熔断等保护机制。 这些机制不是相互排斥的,而是互补的策略,共同保护你的 Spring Boot 应用程序。

1. 限流(流量整形/节流) (Rate Limiting)

  • 定义: 限流控制允许请求进入你的应用程序或特定服务的速率。它设置在给定时间窗口内可以处理的最大请求数量(例如,每秒请求数、每分钟请求数)。

  • 目的:

    • 防止过载: 限流的主要目标是防止你的应用程序被过度的流量压垮。通过限制传入的请求速率,你可以确保你的系统在其容量范围内运行并保持响应能力。
    • 保护上游服务: 如果你的服务调用下游服务,限流还可以通过防止你的服务发送过多的请求并可能使它们过载来保护这些下游服务。
    • 公平资源分配: 限流可用于确保对资源的公平访问,尤其是在多租户系统中。你可以为不同的用户或客户端分配不同的请求配额。
    • 缓解拒绝服务 (DoS) 攻击: 限流可以通过限制来自单个来源或所有来源的请求数量来有效降低 DoS 攻击的影响,从而防止攻击者使你的系统不堪重负。
  • 常用限流算法:

    • 令牌桶 (Token Bucket): 一个桶装有令牌,只有在令牌可用时才能处理请求。令牌以恒定的速率添加到桶中。这是一种常见且灵活的算法,允许突发流量达到桶的容量。
    • 漏桶 (Leaky Bucket): 请求进入一个桶,然后以恒定的速率从桶中处理(泄漏)请求。这可以平滑流量并防止突发。
    • 固定窗口计数器 (Fixed Window Counter): 在固定的时间窗口(例如,1 分钟)内计数请求。一旦窗口过期,计数器就会重置。实现简单,但在窗口边界可能存在“突发”问题。
    • 滑动窗口计数器 (Sliding Window Counter): 类似于固定窗口,但窗口随时间滑动,提供更平滑的限流效果,并避免固定窗口的突发问题。
  • Spring Boot 实现选项:

    • Guava RateLimiter Google Guava 库提供了基于令牌桶算法的简单 RateLimiter。你可以轻松地将其集成到你的 Spring Boot 控制器或服务中。
    • Spring Cloud Gateway Rate Limiter: 如果你正在使用 Spring Cloud Gateway 作为你的 API 网关,它提供了内置的限流功能,使用不同的算法(例如,基于 Redis 的令牌桶,每秒请求数)。
    • Sentinel: 阿里巴巴开源的 Sentinel 是一个强大的流量控制、熔断降级组件。它提供了全面的限流功能,包括各种算法和动态配置。
    • Resilience4j: 虽然主要以熔断和弹性模式而闻名,但 Resilience4j 也提供了限流功能。
    • 自定义拦截器/过滤器: 你可以创建自定义 Spring 拦截器或过滤器来实现你自己的限流逻辑,特别是当你有特定需求或想要与外部限流服务集成时。
    • Redis/Memcached: 你可以使用 Redis 或 Memcached 作为分布式计数器,并使用脚本或客户端逻辑实现限流逻辑。
  • 示例( Guava RateLimiter):

    import com.google.common.util.concurrent.RateLimiter;
    import org.springframework.web.bind.annotation.GetMapping;
    import org.springframework.web.bind.annotation.RestController;
    
    @RestController
    public class MyController {
    
        private final RateLimiter rateLimiter = RateLimiter.create(10.0); // 每秒允许 10 个请求
    
        @GetMapping("/api/resource")
        public String accessResource() {
            if (rateLimiter.tryAcquire()) { // 尝试获取令牌
                // 如果获取到令牌,则处理请求
                return "资源访问成功";
            } else {
                // 达到限流阈值
                return "超出限流阈值。请稍后重试。";
            }
        }
    }
    

2. 降级(回退/回退机制) (Degradation)

  • 定义: 降级,也称为回退,是一种策略,当系统资源紧张或依赖服务出现故障时,为了保证核心服务的可用性,提供降低的或替代的功能。 系统不会完全失败,而是优雅地降低其功能。

  • 目的:

    • 保持核心功能: 降级确保即使系统的某些部分发生故障,核心、最关键的功能仍然可以运行。 你优先考虑基本功能,而不是不太重要的功能。
    • 改善中断期间的用户体验: 降级可以为用户提供降级但仍然可用的体验,而不是显示错误页面或完全失败。 这比完全服务中断要好得多。
    • 防止级联故障: 通过提供回退机制,你可以防止一个服务中的故障传播到依赖于它的其他服务。
    • 资源节约: 在高负载或依赖故障期间,降级可以通过减少故障组件上的负载并将资源集中在基本服务上来帮助节约资源。
  • 常用降级策略:

    • 回退到缓存: 如果主数据源(例如,数据库、外部 API)不可用,则回退到从本地或分布式缓存中提供数据。
    • 返回默认值: 当服务不可用时,返回预定义的默认值或静态数据,而不是动态结果。
    • 简化功能: 在中断期间禁用非必要的功能或特性,以降低负载并维护核心服务。 例如,在电子商务网站中,你可能会在高峰负载期间暂时禁用产品推荐,但保持核心产品浏览和订购功能正常工作。
    • 静态内容: 当动态内容生成失败或缓慢时,从 CDN 或本地存储提供静态内容(例如,HTML 页面、图像)。
    • 熔断器回退: 当熔断器打开时(见下一节),它通常会触发回退机制。
  • Spring Boot 实现选项:

    • Resilience4j @FallbackMethod Resilience4j 的 @CircuitBreaker 和其他弹性注解允许你指定一个 fallbackMethod。 如果带注解的方法失败或熔断器打开,将执行此方法。
    • Hystrix Fallback (遗留): Netflix Hystrix(现在处于维护模式)也使用命令模式和 getFallback() 方法提供了强大的回退机制。
    • 服务中的条件逻辑: 你可以在你的 Spring Boot 服务中直接实现降级逻辑。 这涉及检查服务可用性、资源使用情况或错误条件,并执行替代代码路径(例如,使用 if/else 语句、try-catch 块)。
    • 面向切面编程 (AOP): 你可以使用 AOP 创建可重用的降级逻辑,该逻辑可以应用于多个服务或方法。
    • 外部配置: 使用外部配置(例如,Spring Cloud Config、Consul、etcd)根据系统运行状况动态地启用或禁用功能,或在不同的服务实现之间切换。
  • 示例 (Resilience4j @FallbackMethod):

    import io.github.resilience4j.circuitbreaker.annotation.CircuitBreaker;
    import org.springframework.stereotype.Service;
    
    @Service
    public class ProductService {
    
        @CircuitBreaker(name = "productServiceCB", fallbackMethod = "getProductFallback")
        public String getProductDetails(String productId) {
            // 模拟潜在的服务故障
            if (Math.random() < 0.3) {
                throw new RuntimeException("产品服务已关闭!");
            }
            return "产品 ID 为: " + productId + " 的详细信息"; // 正常服务响应
        }
    
        // 回退方法 - 当 getProductDetails 失败或熔断器打开时执行
        public String getProductFallback(String productId, Throwable throwable) {
            return "产品详细信息目前不可用。请稍后重试或稍后查看。"; // 降级响应
        }
    }
    

3. 熔断 (Circuit Breaking)

  • 定义: 熔断是一种模式,灵感来自电气断路器。 它用于防止应用程序重复尝试调用可能失败的服务。 就像物理断路器一样,当检测到故障时,它会“打开”电路,并将请求重定向到回退或在一段时间内完全阻止它们。

  • 目的:

    • 防止级联故障(再次强调!): 熔断对于防止分布式系统中的级联故障至关重要。 当依赖项开始失败时,熔断器会快速停止对该失败依赖项的进一步请求,从而防止你的服务因等待超时而陷入困境,并可能导致资源耗尽。
    • 快速失败和快速恢复: 熔断器允许快速失败,而不是长时间延迟和超时等待失败的服务。 它会立即返回失败响应或触发回退机制。 它还可以实现更快的恢复,因为熔断器可以在一段时间后“自愈”,并自动尝试重新建立与依赖项的连接。
    • 保护故障服务: 通过停止对故障服务的请求,熔断器使该服务有时间恢复,而不会因持续的请求而进一步过载。
    • 提高系统稳定性: 熔断器通过隔离故障并防止其蔓延,显着提高了分布式系统的整体稳定性和弹性。
  • 熔断器状态:

    • 关闭 (Closed): 正常运行。 请求会传递到依赖项。 熔断器监控请求的成功/失败率。
    • 打开 (Open): 当失败率超过配置的阈值时,熔断器会“打开”。 在打开状态下,所有后续对依赖项的请求都会立即失败(或重定向到回退),而无需尝试调用依赖项。
    • 半开 (Half-Open): 在打开状态下经过配置的“等待持续时间”后,熔断器会转换为半开状态。 在此状态下,它允许有限数量的“探测”请求传递到依赖项。 如果这些探测请求成功,则熔断器再次关闭(返回到关闭状态)。 如果它们失败,则熔断器重新打开(返回到打开状态),并且等待持续时间计时器重置。
  • 熔断器指标(触发条件):

    • 错误率阈值: 在一段时间或请求的滑动窗口内,失败请求的百分比。 当超过此阈值时,熔断器会打开。
    • 故障计数阈值: 滑动窗口内故障的绝对数量。
    • 慢调用率阈值: 超过配置的慢调用持续时间阈值的请求百分比。
    • 组合指标: 熔断器可以使用这些指标的组合来确定何时打开。
  • Spring Boot 实现选项:

    • Resilience4j @CircuitBreaker Resilience4j 使用 @CircuitBreaker 注解和编程 API 提供了强大的熔断器实现。 它是 Hystrix 的现代且积极维护的替代方案。
    • Hystrix @HystrixCommand (遗留): Netflix Hystrix 是最初流行的 Java 熔断器库。 虽然现在处于维护模式,但许多较旧的 Spring Boot 项目仍在使用 Hystrix。
    • Spring Cloud Circuit Breaker (抽象): Spring Cloud 提供了一个 spring-cloud-starter-circuitbreaker 抽象,允许你在不同的熔断器实现(如 Resilience4j 或 Hystrix)之间切换,而无需显着更改你的应用程序代码。
    • Sentinel: Sentinel 还包括熔断功能,作为其更广泛的流量控制和弹性功能的一部分。
    • 自定义实现: 你可以构建自己的熔断器逻辑,但通常建议使用像 Resilience4j 或 Hystrix 这样的已建立的库,因为它们处理了状态管理、计时器和线程安全性的复杂性。
  • 示例 (Resilience4j @CircuitBreaker):

    import io.github.resilience4j.circuitbreaker.annotation.CircuitBreaker;
    import org.springframework.stereotype.Service;
    
    @Service
    public class InventoryService {
    
        @CircuitBreaker(name = "inventoryServiceCB", fallbackMethod = "getInventoryFallback")
        public int checkInventory(String productId) {
            // 模拟调用可能失败的库存服务
            if (Math.random() < 0.4) {
                throw new RuntimeException("库存服务不可用!");
            }
            return 100; // 假设库存可用
        }
    
        public int getInventoryFallback(String productId, Throwable throwable) {
            // 当服务不可用时,返回默认库存级别
            return 0; // 表示没有库存可用(降级响应)
        }
    }
    

总结:

  • 限流: 控制进入你的应用程序的流量,以防止过载。
  • 降级: 当服务不可用时,提供降低的功能替代响应,保持核心功能和用户体验。
  • 熔断: 停止向失败的依赖项发送请求,防止级联故障,实现快速失败,并允许更快地恢复。

这三种机制对于构建健壮、可扩展且容错的 Spring Boot 微服务至关重要,这些微服务可以承受高流量、依赖故障以及分布式环境中的其他挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/977418.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redission可重试、超时续约的实现原理(源码分析)

Redission遇到其他进程已经占用资源的时候会在指定时间waitTime内进行重试。实现过程如下&#xff1a; 执行获取锁的lua脚本时&#xff0c;会返回一个值&#xff0c; 如果获取锁成功&#xff0c;返回nil&#xff0c;也就是java里的null 如果获取锁失败&#xff0c;用语句“PT…

ue----git局域网内部署裸仓库,别的机器进行访问

最近由于经常迁移项目到另一台机器上进行部署更新一点就要整个迁移 弄得麻烦了 就在网上学了一下这个方式 首先我们在想要建立裸仓库的电脑上找到一个文件夹放置我们的裸仓库 在此点击鼠标右键选择 open git bash here 输入命令 创裸仓库 git init --bare gitTestName.git…

输入搜索、分组展示选项、下拉选取,el-select 实现:即输入关键字检索,返回分组选项,选取跳转到相应内容页 —— VUE 项目-全局模糊检索

后端数据代码写于下一篇&#xff1a;输入搜索、分组展示选项、下拉选取&#xff0c;全局跳转页&#xff0c;el-select 实现 —— 后端数据处理代码&#xff0c;抛砖引玉展思路 【效果图】&#xff1a;分组展示选项 >【提供界面操作体验】 【录制效果视频展示】&#xff1a…

【UCB CS 61B SP24】Lecture 11 - Inheritance 4: Iterators, Object Methods学习笔记

本文内容为集合&#xff08;Set&#xff09;的介绍与使用&#xff0c;并通过数组手动实现集合&#xff0c;接着介绍了迭代器&#xff0c;使用迭代器我们能够更方便地遍历集合中的元素。 1. Set 1.1 Set介绍与Java实现类的使用 集合&#xff08;Set&#xff09;是一种常见的数…

玩机日记 12 fnOS使用lucky反代https转发到外网提供服务

目录 1、安装lucky 2、更新lucky 3、上传ssl证书 4、设置安全入口&#xff0c;替换fnOS的应用url 5、添加https反代 这一篇主要是解决一下飞牛反代https的问题。可以先看玩机日记 12.5 在PVE Windows11上部署本地AI模型&#xff0c;使用群晖反代https转发到外网提供服务&a…

神经网络八股(3)

1.什么是梯度消失和梯度爆炸 梯度消失是指梯度在反向传播的过程中逐渐变小&#xff0c;最终趋近于零&#xff0c;这会导致靠前层的神经网络层权重参数更新缓慢&#xff0c;甚至不更新&#xff0c;学习不到有用的特征。 梯度爆炸是指梯度在方向传播过程中逐渐变大&#xff0c;…

【ARM】MDK如何生成指定大小的bin文件,并指定空区域的填充数据

1、 文档目标 解决MDK如何生成指定大小的bin文件&#xff0c;并指定空区域的填充数据 2、 问题场景 客户有这样的需求&#xff0c;客户本身的工程编译生成bin文件后&#xff0c;bin文件大小为200k。整体芯片的内存有512k。客户想要最终生成的bin文件可以达到512k的一个情况&a…

Linux-----进程间通信

一、按通信范围分类 同一主机进程通信 传统IPC方式&#xff1a; 管道&#xff08;无名管道、有名管道&#xff09;信号&#xff08;Signal&#xff09; System V IPC&#xff1a; 共享内存&#xff08;效率最高&#xff09;消息队列信号量 POSIX IPC&#xff08;较新标准&#…

Part 3 第十二章 单元测试 Unit Testing

概述 第十二章围绕单元测试展开&#xff0c;阐述了单元测试的实践与重要性&#xff0c;通过对比其他测试类型&#xff0c;突出其特点&#xff0c;还介绍了单元测试的最佳实践、避免的反模式以及与测试替身相关的内容&#xff0c;为编写高质量单元测试提供指导。 章节概要 1…

Windows10配置C++版本的Kafka,并进行发布和订阅测试

配置的环境为&#xff1a;Release x64下的环境 完整项目&#xff1a;https://gitee.com/jiajingong/kafka-publisher 1、首先下载相应的库文件&#xff08;.lib&#xff0c;.dll&#xff09; 参考链接&#xff1a; GitHub - eStreamSoftware/delphi-kafka GitHub - cloade…

Deepseek引爆AI热潮 防静电地板如何守护数据中心安全

近期&#xff0c;Deepseek的爆火将人工智能推向了新的高度&#xff0c;也引发了人们对AI背后基础设施的关注。作为AI运行的“大脑”&#xff0c;数据中心承载着海量数据的存储、处理和传输&#xff0c;其安全稳定运行至关重要。而在这背后&#xff0c;防静电地板扮演着不可或缺…

Spring框架基本使用(Maven详解)

前言&#xff1a; 当我们创建项目的时候&#xff0c;第一步少不了搭建环境的相关准备工作。 那么如果想让我们的项目做起来方便快捷&#xff0c;应该引入更多的管理工具&#xff0c;帮我们管理。 Maven的出现帮我们大大解决了管理的难题&#xff01;&#xff01; Maven&#xf…

QSplashScreen --软件启动前的交互

目录 QSplashScreen 类介绍 使用方式 项目中使用 THPrinterSplashScreen头文件 THPrinterSplashScreen实现代码 使用代码 使用效果 QSplashScreen 类介绍 QSplashScreen 是 Qt 中的一个类&#xff0c;用于显示启动画面。它通常在应用程序启动时显示&#xff0c;以向用户显…

【Vscode 使用】集合1

一、使用make工具管理工程 windows下&#xff0c;下载mingw64&#xff0c;配置好mingw64\bin 为 Win10系统全局变量后。 在mingw64/bin目录下找到mingw32-make.exe工具。复制一份改名为&#xff1a;make.exe&#xff0c;没错&#xff0c;就是那么简单&#xff0c;mingw64自带m…

PHP-create_function

[题目信息]&#xff1a; 题目名称题目难度PHP-create_function2 [题目考点]&#xff1a; create_function ( string args , string args , string code )[Flag格式]: SangFor{wWx5dEGHHhDUwmST4bpXwfjSzq43I6cz}[环境部署]&#xff1a; docker-compose.yml文件或者docker …

golang内存泄漏

golang也用了好几年了&#xff0c;趁着有空 整理归纳下&#xff0c;以后忘了好看下 一般认为 Go 10次内存泄漏&#xff0c;8次goroutine泄漏&#xff0c;1次是真正内存泄漏&#xff0c;还有1次是cgo导致的内存泄漏 1:环境 go1.20 win10 2:goroutine泄漏 单个Goroutine占用内存&…

Python Seaborn库使用指南:从入门到精通

1. 引言 Seaborn 是基于 Matplotlib 的高级数据可视化库,专为统计图表设计。它提供了更简洁的 API 和更美观的默认样式,能够轻松生成复杂的统计图表。Seaborn 在数据分析、机器学习和科学计算领域中被广泛使用。 本文将详细介绍 Seaborn 的基本概念、常用功能以及高级用法,…

修改与 Git 相关的邮箱

要修改与 Git 相关的邮箱信息&#xff0c;需要区分以下两种情况&#xff1a; 1. 修改 Git 提交时使用的邮箱&#xff08;影响提交记录&#xff09; Git 提交记录中的邮箱由本地 Git 配置的 user.email 决定&#xff0c;与 SSH 密钥无关。修改方法如下&#xff1a; 全局修改&a…

用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解

DeepSeek R1 的完整训练流程核心在于&#xff0c;在其基础模型 DeepSeek V3 之上&#xff0c;运用了多种强化学习策略。 本文将从一个可本地运行的基础模型起步&#xff0c;并参照其技术报告&#xff0c;完全从零开始构建 DeepSeek R1&#xff0c;理论结合实践&#xff0c;逐步…

基于SpringBoot的“流浪动物救助系统”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“流浪动物救助系统”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringBoot 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能结构图 局部E-R图 系统首页界面 系统…