【数据结构】滑动窗口算法详解:高效解决子串问题

滑动窗口(Sliding Window)是一种常用于处理数组或字符串中子序列问题的算法技巧。它通过维护一个窗口来限制待处理的数据范围,从而高效地解决问题,避免重复计算。它的时间复杂度通常为 O(N),相较于暴力破解(时间复杂度 O(N^2))大大提升了效率。

如果你还不了解什么是子串或者时间复杂度,可参考以下文章:

  • 【计算机科学】什么是子串?全面解析及应用场景
  • 【数据结构】时间复杂度和空间复杂度是什么?

滑动窗口的核心思想

滑动窗口可以看作是在数组或字符串上移动的一个固定大小的子区间。通过将窗口在数据上滑动,我们能够逐步考察不同的子区间,进而找到满足条件的解。滑动窗口的两个关键操作是:

  1. 扩展窗口(Expand Window):增大窗口的右边界,以包括新的元素。
  2. 收缩窗口(Shrink Window):缩小窗口的左边界,以排除不满足条件的元素。

在滑动窗口问题中,通常需要找到满足某些条件的子数组或子字符串的最优解(如最大值、最小值、特定元素组合等)。因此,滑动窗口常用于以下几类问题:

  • 最小或最大子数组和
  • 找到包含特定字符的最小子串
  • 连续子序列的最优解

算法步骤

  1. 使用两个指针 leftright 表示窗口的左右边界。
  2. 使用一个变量来记录窗口中的字符是否重复。
  3. 外层循环扩展 right 指针,将字符加入窗口。如果满足条件,将其加入窗口;否则,通过移动 left 指针移除最左边界。
  4. 统计并记录窗口的最大长度。

算法模板

// l 控制左边界,r 控制右边界,每次循环右边界不断拓展
for (int l = 0, r = 0; r < s.length(); ++r) {
    // 判断是否需要收缩左边界(check()函数的具体实现)
    while (l <= r && check()) {
        // 实现左边界的收缩
    }
    // 进行统计操作
}

算法实战:无重复字符的最长子串

题目链接:无重复字符的最长子串

题目描述:给定一个字符串 s,找到其中不包含重复字符的最长子串的长度。

示例 1:

输入: s = "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。

示例 2:

输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。

示例 3:

输入: s = "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。

算法构建

  1. 使用 left, right 两个指针维护左右边界。
  2. 使用一个哈希集合来维护字符是否出现过。
  3. 外层循环不断扩展右边界,内层循环判断当前字符是否已经出现过。如果已出现,则不断收缩左边界直到满足条件。
  4. 将当前字符标记为已出现。
  5. 计算最长子串(通过右边界和左边界的差值)。

代码实现:

using namespace std;

int lengthOfLongestSubstring(const string& s) {
    int max_length = 0; // 最长子串长度
    unordered_set<char> char_set; // 用于记录出现的字符
    int left = 0; // 左边界

    // 外循环控制右边界
    for (int right = 0; right < s.length(); ++right) {
        // 收缩左边界,直到当前字符不再出现
        while (char_set.find(s[right]) != char_set.end()) {
            char_set.erase(s[left++]);
        }
        char_set.insert(s[right]); // 插入当前字符
        max_length = max(max_length, right - left + 1); // 更新最大长度
    }

    cout << "最长无重复子串的长度为: " << max_length << endl;
    return max_length;
}
为何 r - l + 1 要额外 + 1

r - l + 1 是为了计算当前不重复子串的长度。

  • rl 分别是右边界和左边界,表示当前窗口的范围。
  • 当前窗口的长度是从索引 lr,但如果直接计算 r - l,结果只会包含从 lr-1 的元素,因为这个差值不包括右边界 r 自身。
  • 因此,我们需要加上 1 来确保当前窗口的长度包含 r 对应的字符。

例如,假设 l = 2r = 4,当前窗口是从索引 2 到 4,那么子串的实际长度应该是 4 - 2 + 1 = 3,表示字符在索引 2、3、4 这三个位置。

原理分析

我们可以使用测试用例1来举例:
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

以此不断类推,可得到最终的 ans 答案为 3。

复杂度分析

由于只需要对 n 访问一次,所以时间复杂度为 O(N)。

在最坏的情况下,char_set 需要存储 n 个字符,因此空间复杂度为 O(N)。

类比暴力枚举

相比常见的暴力枚举,滑动窗口方法高效得多。暴力枚举的例子如下:

class Solution {
public:
    int lengthOfLongestSubstring(const string& s) {
        int max_len = 0; // 使用更具语义化的变量名
        for (int i = 0; i < s.length(); ++i) {
            int t = getSubstringLength(s, i);
            max_len = std::max(max_len, t); // 使用 std::max
        }
        cout << max_len << endl;
        return max_len;
    }

private:
    static int getSubstringLength(const string& s, int index) {
        int t = 0;
        unordered_set<char> seen; // 使用 unordered_set 简化
        for (int i = index; i < s.length(); ++i) {
            char c = s[i];
            if (seen.find(c) == seen.end()) {
                t++;
                seen.insert(c);
            } else {
                return t;
            }
        }
        return t;
    }
};

暴力枚举的时间复杂度为 O(N^2),因为外层循环每执行一次,内层循环都会从 index 循环到 n(输入字符串的长度)。总的执行次数为:

n + (n - 1) + (n - 2) + … + 1,其为等差数列,和为 n(n + 1) / 2,因此时间复杂度为 O(N^2)。

在空间复杂度方面,seen 在最坏情况下可能存储 n 个字符,因此复杂度为 O(N)。

总结

滑动窗口算法通过优化重复计算,显著提高了处理子串问题的效率。理解其原理和应用场景,可以帮助我们在算法竞赛及实际编程中更有效地解决问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/895455.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Go 项目如何集成类似mybatisPlus插件呢?GORM走起!!

导读&#xff1a; 在 Go 项目中&#xff0c;虽然没有像 MyBatis Plus 这样特定的 ORM 插件&#xff0c;但可以使用功能相似的 Go ORM 框架&#xff0c;比如 GORM&#xff0c;它支持链式查询、自动迁移、预加载等功能&#xff0c;与 MyBatis Plus 有相似之处。通过一些插件或扩…

常用API

Object类&#xff1a; instanceof&#xff1a;java中的关键字&#xff0c;判断左边的对象是否是右面类的实例。 它的作用是判断其左边对象是否为其右边类的实例&#xff0c;返回boolean类型的数据。 getClass()&#xff1a;得到调用者的数据类型&#xff1b; 进行对象内容比较…

016_基于python+django网络爬虫及数据分析可视化系统2024_kyz52ks2

目录 系统展示 开发背景 代码实现 项目案例 获取源码 博主介绍&#xff1a;CodeMentor毕业设计领航者、全网关注者30W群落&#xff0c;InfoQ特邀专栏作家、技术博客领航者、InfoQ新星培育计划导师、Web开发领域杰出贡献者&#xff0c;博客领航之星、开发者头条/腾讯云/AW…

盘点现代浏览器的各种神奇能力,功能令人惊讶

盘点现代浏览器的各种神奇能力&#xff0c;功能令人惊讶&#x1f62e; 浏览器的进化 一个运行在浏览器里面的操作系统。一个炫酷的量子纠缠网页。内嵌在浏览器里面的AI大模型。 随着web技术的迅猛发展&#xff0c;现代浏览器已经不仅仅是一个浏览网页的工具了。它的功能早已进…

【判断推理】逻辑论证之归因论证

2.1 归因论证概述 归因&#xff1a;指人们对 他人或自己行为的原因的推论过程。具体而言&#xff0c;就是观察者对他人的行为过程或自己的行为过程所进行的因果解释和推论。&#xff08;通俗而言&#xff0c;归因就是对已经发生的事实&#xff0c;在众多可能的原因中找出一个原…

Cesium 实战 - 自定义纹理材质 - 立体墙(旋转材质)

Cesium 实战 - 自定义纹理材质 - 立体墙(旋转材质) 核心代码完整代码在线示例Cesium 给实体对象(Entity)提供了很多实用的样式,基本满足普通项目需求; 但是作为 WebGL 引擎,肯定不够丰富,尤其是动态效果样式。 对于实体对象(Entity),可以通过自定义材质,实现各种…

CLion和Qt 联合开发环境配置教程(Windows和Linux版)

需要安装的工具CLion 和Qt CLion下载链接 :https://www.jetbrains.com.cn/clion/ 这个软件属于直接默认安装就行&#xff0c;很简单&#xff0c;不多做介绍了 Qt:https://mirrors.tuna.tsinghua.edu.cn/qt/official_releases/online_installers/ window 直接点exe Linux 先c…

【2024软著申请】软著申请到发放全流程(附带教程+工具+撰写建议)

目录 总时间线材料准备1、计算机软件著作权登记申请表4页2、身份证明文件3、软件鉴别材料4、文档鉴别材料 唠叨两句 总时间线 时间关键节点20240811电子材料提交进入待受理阶段20240826受理阶段审查通过&#xff0c;进入审查中20240930发放完成 材料准备 版权登记链接(https…

用柔性神经k-Opt学习搜索路径问题的可行和不可行区域(未完,先看前驱文章L2S)

文章目录 Abstract1 IntroductionAbstract 介绍了一种名为 Neural k-Opt(NeuOpt)的新型学习搜索(L2S)求解器,用于解决路径问题。它学习执行基于定制的动作分解方法和定制的循环双流(Recurrent Dual-Stream)解码器的灵活 k-opt 交换。 作为一项开创性的工作,我们绕过了…

华山论剑之Rust的Trait

华山论剑&#xff0c;群雄荟萃&#xff0c;各显神通。武林中人&#xff0c;各有所长&#xff0c;或剑法飘逸&#xff0c;或掌法刚猛&#xff0c;或轻功绝顶。这就好比Rust中的trait&#xff0c;它定义了一种武功套路&#xff0c;而不同的门派、不同的人&#xff0c;可以将这套武…

All-reduce,AIl-to-all

目录 跨中心架构下的大模型并行训练 优化All-reduce通信效率 优化AIl-to-all通信效率 跨中心架构下的大模型并行训练 优化All-reduce通信效率 All-reduce是一种在分布式计算中广泛使用的通信操作,用于将多个节点的数据聚合成一个全局结果,并将该结果分发回所有节点。优化…

sv标准研读第十五章-进程间同步与通信

书接上回&#xff1a; sv标准研读第十四章-clocking block 第15章 进程间的同步和通信 15.1 概览 -semaphores -mailboxes -named events 15.2 综述 简单的进程间通信可以通过named events来实现&#xff0c;有event trigger和event control过程&#xff0c;分别需要依…

Elasticsearch基本使用及介绍

Elasticsearch 1. 关于各种数据库的使用 关于MySQL&#xff1a;是关系型数据库&#xff0c;能清楚的表示数据之间的关系&#xff0c;并且&#xff0c;是基于磁盘存储的&#xff0c;可以使用相对较低的成本存储大量的数据 关于Redis&#xff1a;是基于K-V结构的在内存中读写数…

2011年国赛高教杯数学建模B题交巡警服务平台的设置与调度解题全过程文档及程序

2011年国赛高教杯数学建模 B题 交巡警服务平台的设置与调度 有困难找警察”&#xff0c;是家喻户晓的一句流行语。警察肩负着刑事执法、治安管理、交通管理、服务群众四大职能。为了更有效地贯彻实施这些职能&#xff0c;需要在市区的一些交通要道和重要部位设置交巡警服务平台…

【jQuery】jQuery 处理 Ajax 以及解决跨域问题的方式

文章目录 HTTP原生创建 AjaxjQuery 处理 Ajax$.ajax()$().load()$.get()$.post() 跨域CORSJSONPiframeweb sockets HTTP 超文本传输协议&#xff08;HTTP&#xff0c;HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。设计 HTTP 最初的目的是为了提供一种发…

QT中中文显示乱码问题

在VS2013中用QT开发GUI应用程序&#xff0c;Qt中显示中文乱码 一&#xff1a; //解决QT中中文显示乱码问题 #pragma execution_character_set("utf-8") 二&#xff1a;在main函数中添加以下代码&#xff1a; #include <QTextCodec>void main() {QTextCod…

javaweb-mybatis之动态sql

(1).if标签 编写好方法之后&#xff0c;选中方法名&#xff0c;alt回车&#xff0c;选第一个generate statement快捷生成xml里的标签 (2).foreach标签 用于批量删除 (3)sql和include标签

别再犯这些Java并发编程的常见错误!你中了几个?

你好&#xff0c;我是忆~遂愿&#xff0c;全网2w粉丝&#xff0c;《遂愿盈创》社群主理人。 副业启航① | 遂愿盈创&#xff08;对副业感兴趣免费可入&#xff0c;多种赚钱实战项目等你来&#xff0c;一起探寻副业快速变现的途径&#xff1b;以及对接互联网大厂商务合作&#x…

YOLO11改进 | 主干网络 | 将backbone替换为Swin-Transformer结构【论文必备】

秋招面试专栏推荐 &#xff1a;深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 &#x1f4a1;&#x1f4a1;&#x1f4a1;本专栏所有程序均经过测试&#xff0c;可成功执行&#x1f4a1;&#x1f4a1;&#x1f4a1; 本文给大家带来的教程是将YOLO11的backb…

二百六十八、Kettle——同步ClickHouse清洗数据到Hive的DWD层静态分区表中(每天一次)

一、目的 实时数仓用的是ClickHouse&#xff0c;为了避免Hive还要清洗数据&#xff0c;因此就直接把ClickHouse中清洗数据同步到Hive中就行 二、所需工具 ClickHouse&#xff1a;clickhouse-client-21.9.5.16 Kettle&#xff1a;kettle9.2 Hadoop&#xff1a;hadoop-3.1.3…