专题二 - 滑动窗口 - leetcode 30. 串联所有单词的子串 | 困难难度

leetcode 30. 串联所有单词的子串

  • leetcode 30. 串联所有单词的子串 | 困难难度
    • 1. 题目详情
      • 1. 原题链接
      • 2. 基础框架
    • 2. 解题思路
      • 1. 题目分析
      • 2. 算法原理
      • 3. 时间复杂度
    • 3. 代码实现
      • 滑动窗口,并使用遍历判断两个哈希表是否相等
      • 滑动窗口,引入有效字符计数count
    • 4. 知识与收获

在这里插入图片描述

leetcode 30. 串联所有单词的子串 | 困难难度

1. 题目详情

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同

s 中的 串联子串 是指一个包含 words 中所有字符串任意顺序排列连接起来的子串。

例如,如果 words = [“ab”,“cd”,“ef”], 那么 “abcdef”, “abefcd”,“cdabef”, “cdefab”,“efabcd”, 和 “efcdab” 都是串联子串。 “acdbef” 不是串联子串,因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

示例 1:
输入:s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出:[0,9]
解释:因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 “barfoo” 开始位置是 0。它是 words 中以 [“bar”,“foo”] 顺序排列的连接。
子串 “foobar” 开始位置是 9。它是 words 中以 [“foo”,“bar”] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:
输入:s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出:[]
解释:因为 words.length == 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3:
输入:s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出:[6,9,12]
解释:因为 words.length == 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
子串 “foobarthe” 开始位置是 6。它是 words 中以 [“foo”,“bar”,“the”] 顺序排列的连接。
子串 “barthefoo” 开始位置是 9。它是 words 中以 [“bar”,“the”,“foo”] 顺序排列的连接。
子串 “thefoobar” 开始位置是 12。它是 words 中以 [“the”,“foo”,“bar”] 顺序排列的连接。

提示:
1 <= s.length <= 104
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

1. 原题链接

leetcode 30. 串联所有单词的子串

2. 基础框架

● Cpp代码框架

class Solution {
public:
    vector<int> findSubstring(string s, vector<string>& words) {

    }
};

2. 解题思路

1. 题目分析

( 1 ) (1) (1) 本题给出一个字符串s和字符串数组words,且words中字符串的长度相同,这是很关键的一句话。找出s的所有子串中是words串联子串的起始下标。串联子串就是words字符串以任意顺序排列形成的字符串。注意排列的单位是字符串,而不是字符,且这些字符串长度相等。
如果题目没有words中字符串长度相等这句话,这道题将会变得很麻烦,因为串联子串的定义单位是字符串,但我们遍历的时候只能是一步一步的遍历,每次一个字符被加入s的以遍历子串中,并被记录在哈希表中。所以可能会出现这种情况:我们遍历的s中的子串字符频次是与words中所有字符串对应字符频次是相同的,但是并不满足串联子串的要求。

而题目中提示我们words的字符串长度都相同,我们把单个字符串的长度记为len。那么我们可以把s分成len个长度的一个个小区间,例如从0下标开始划分:[0, len-1] [len, 2*len-1] [2*len, 3*len-1]......,这样一直到s结束,把s划分成了区间,把s也看做由一个个小字符串组成的大字符串,遍历字符串s时,每次的步长是len,而不再是1。
s以len长度划分图-》
在这里插入图片描述

但是只进行一次划分是不够的,因为每次遍历的步长是len,所以会漏掉部分情况:比如[1, len]以及之后的情况。所以划分方式是分别以0、1、2...len-1为起始位置,进行长度为len的划分,这样就把所有的情况考虑到了。既然s被多次划分,所以也需要相同次数len次的遍历。

( 2 ) (2) (2) 对于暴力枚举:需要三层循环,外层循环len次,表示每次的s划分。内层经典两层循环,固定一个起始已划分位置leftrightleft开始依次向右遍历已划分的s,每次步长是len。
两个哈希表的键值是<string, int>,哈希表1hash1记录words内字符串的频次,哈希表2hash2记录遍历的字符串的频次。在遍历的字符串个数等于words的字符串的个数,就判断两个哈希表是否相等,如果相等则当前遍历的子串[left, right+len - 1]就是符合题意的串联子串,否则就不是,且以right及其之后的所有位置为结束的子串都不会是串联子串,就没有遍历的必要了。left+=len以新的起始位置,同时right回退到新left位置,哈希表2hash清空,重新开始遍历。
( 3 ) (3) (3)

2. 算法原理

( 1 ) (1) (1) 对于暴力枚举,right不需要每次都回退到left位置,哈希表2hash2也不需要每次都清空,再重新开始遍历。
滑动窗口:
每次right位置为结尾的子串不满足题意(串联子串)时,right不再回退,hash2不再清空,而是left每次右移len长度,同时以left为起始的len个长度的子串被移出哈希表2hash2
在这里插入图片描述

初始m = words.size(), len = words[0].size(),ret是结果数组
( 2 ) (2) (2)进窗口:hash2[s.substr(right, len)]++;
( 3 ) (3) (3)判断:right-left+1 > m * len;
( 4 ) (4) (4)出窗口:hash2[s.substr(left, len)]- -,left- -;
( 5 ) (5) (5)更新结果:在right - left == (m - 1) * len,且两个哈希表hash1hash2相等时
把left作为一个结果加入到结果ret数组内;

( 6 ) (6) (6)对哈希表判断相等的优化:引入有效字符串计数count,作用是记录哈希表2hash2和哈希表1hash1都出现的字符串。
进窗口 + 维护count:in = s.substr(right,len) ;hash2[in]++;hash2[in] <= hash1[in]时进入的是有效字符,count++;
判断:right-left+1 > m*len时
出窗口 + 维护count:out = s.substr(left,len);hash2[out] <= hash1[out] 时移除的是有效字符,count–;hash2[out]–;
更新结果:count == m时,把left加入到结果数组ret中;

3. 时间复杂度

暴力枚举 O ( n 2 / l e n ) O(n^2/len) O(n2/len)

字符串s长度为n,words内字符串长度为len,划分成了n/len个组,共进行了len次划分,故循环次数 l e n ∗ n / l e n ∗ n / l e n = = n 2 / l e n len*n/len*n/len == n^2/len lenn/lenn/len==n2/len

滑动窗口 O ( n ) O(n) O(n)

l e n ∗ n / l e n = = n len*n/len==n lenn/len==n

3. 代码实现

滑动窗口,并使用遍历判断两个哈希表是否相等

class Solution {
public:
    vector<int> findSubstring(string s, vector<string>& words) {
        vector<int> ret;
        unordered_map<string, int> hash1;
        for(auto& e : words) hash1[e]++;//记录words内字符串的频次
        
        int n = s.size();
        int len = words[0].size();
        int m = words.size();

        for(int i = 0; i < len; i++){//以len对s进行划分,不同的划分方式是len种,即分别以0,1,2,...,len-1为起始的划分
            int l = i, r = i;//滑动窗口初始化
            unordered_map<string, int> hash2;
            while(r + len <= n){//r的步长是len,所以需要防止越界访问
                string in = s.substr(r, len);//切割得到子串
                hash2[in]++;//进窗口
                while(r - l + 1 > len * m){//判断窗口内字符个数是否超过words内所有字符个数
                    string out = s.substr(l, len);
                    hash2[out]--;//出窗口
                    //if(hash2[out] == 0) hash2.erase(out);
                    l += len;
                }
                if(r - l == (words.size() - 1) * len){//更新结果
                    int flag = 1;
                    for(auto& str : words){//判断两个哈希表是否相等
                        if(hash1[str] != hash2[str]){
                            flag = 0;
                            break;
                        }
                    }
                    if(flag) ret.push_back(l);
                }
                r += len;//为下一次元素进窗口做准备
            }
        }
        return ret;
    }
};

滑动窗口,引入有效字符计数count

class Solution {
public:
    vector<int> findSubstring(string s, vector<string>& words) {
        vector<int>ret;
        unordered_map<string, int> hash1;
        for(auto& e : words) hash1[e]++;// 记录字符串频次
        int n = s.size();
        int m = words.size();
        int len = words[0].size();
        
        for(int i = 0; i < len; ++i){
            int l = i, r = i;
            unordered_map<string, int> hash2;
            int count =  0;
            while(r + len <= n){
                // 进窗口,维护count
                string in = s.substr(r, len);
                hash2[in]++;
                if(hash1.count(in) && hash2[in] <= hash1[in]) count++;
                // 判断
                while(r - l + 1 > len * m){
                    // 出窗口,维护count
                    string out = s.substr(l, len);
                    if(hash1.count(out) && hash2[out] <= hash1[out]) count--;
                    hash2[out]--;
                    l += len;
                }
                // 更新结果
                if(count == m) ret.push_back(l);
                r += len;
            }
            
        }
        return ret;
    }
};

4. 知识与收获

( 1 ) (1) (1) 本题关键的一点:words内字符串长度相等,这样就可以依此把字符串作为整体,把s划分成一个个的子串,进行遍历操作了。


T h e The The E n d End End

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/455592.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

libusb_Qt使用

Libusb libusb_github 建议直接下载库&#xff0c;编译好麻烦 QT调用 .pro文件添加&#xff1a; win32: LIBS -L$$PWD/LIB/libusb/x64/ -llibusb-1.0.cpp调用即可 #include "LIB/libusb/libusb.h" void class_name::fun(){/* 1. */libusb_init(NULL);/**/str…

软考高级:信息系统开发方法2(形式化方法、统计过程方法等)概念和例题

作者&#xff1a;明明如月学长&#xff0c; CSDN 博客专家&#xff0c;大厂高级 Java 工程师&#xff0c;《性能优化方法论》作者、《解锁大厂思维&#xff1a;剖析《阿里巴巴Java开发手册》》、《再学经典&#xff1a;《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

【深度学习目标检测】二十三、基于深度学习的行人检测计数系统-含数据集、GUI和源码(python,yolov8)

行人检测计数系统是一种重要的智能交通监控系统&#xff0c;它能够通过图像处理技术对行人进行实时检测、跟踪和计数&#xff0c;为城市交通规划、人流控制和安全管理提供重要数据支持。本系统基于先进的YOLOv8目标检测算法和PyQt5图形界面框架开发&#xff0c;具有高效、准确、…

42.坑王驾到第八期:uniCloud报错

uniCloud 报错 今天调用云函数来调试小程序的时候突然暴了一个奇葩错误&#xff0c;require(…).main is not a function。翻官方文档后发现&#xff0c;原来是这样&#xff1a;**如果你写的是云对象&#xff0c;入口文件应为 index.obj.js&#xff0c;如果你写的是云函数入口…

在centOS服务器安装docker,并使用docker配置nacos

遇到安装慢的情况可以优先选择阿里镜像 安装docker 更新yum版本 yum update安装所需软件包 yum install -y yum-utils device-mapper-persistent-data lvm2添加Docker仓库 yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.rep…

CentOS 7安装MySQL及初始化操作教程

一、引言 MySQL是一款广泛使用的开源关系型数据库管理系统&#xff0c;适用于各种规模的应用场景。在CentOS 7系统中安装MySQL并进行初始化操作&#xff0c;可以为我们的应用程序提供稳定、可靠的数据存储服务。本文将详细介绍CentOS 7安装MySQL及初始化操作的步骤。 目录 一、…

Midjourney绘图欣赏系列【人物篇】(一)

Midjourney介绍 Midjourney 是生成式人工智能的一个很好的例子&#xff0c;它根据文本提示创建图像。它与 Dall-E 和 Stable Diffusion 一起成为最流行的 AI 艺术创作工具之一。与竞争对手不同&#xff0c;Midjourney 是自筹资金且闭源的&#xff0c;因此确切了解其幕后内容尚不…

2024 年排名前 5 名的 Mac 数据恢复软件分享

如果您已经在 Mac 上丢失了数据并且正在寻找恢复数据的方法&#xff0c;那么您来对地方了。互联网上有超过 50 个适用于 Mac 的数据恢复程序。哪个是最好的 Mac 数据恢复软件&#xff1f;不用担心。本文列出了 5 款 Mac 数据恢复软件&#xff0c;可帮助您在 Mac OS 下恢复丢失的…

C++程序设计-第六/七/八章 运算符重载/包含与继承/虚函数和多态性【期末复习|考研复习】

前言 总结整理不易&#xff0c;希望大家点赞收藏。 给大家整理了一下C程序设计中的重点概念&#xff0c;以供大家期末复习和考研复习的时候使用。 C程序设计系列文章传送门&#xff1a; 第一章 面向对象基础 第四/五章 函数和类和对象 第六/七/八章 运算符重载/包含与继承/虚函…

OpenResty使用Lua大全(三)OpenResty使用Json模块解析json

文章目录 系列文章索引一、使用Json模块1、引入cjson模块2、table转json字符串3、json字符串转table4、异常处理&#xff08;1&#xff09;异常复现&#xff08;2&#xff09;使用pcall命令&#xff08;3&#xff09;cjson.safe 模块 5、空table返回object还是array 系列文章索…

STM32串口通信—串口的接收和发送详解

目录 前言&#xff1a; STM32串口通信基础知识&#xff1a; 1&#xff0c;STM32里的串口通信 2&#xff0c;串口的发送和接收 串口发送&#xff1a; 串口接收&#xff1a; 串口在STM32中的配置&#xff1a; 1. RCC开启USART、串口TX/RX所对应的GPIO口 2. 初始化GPIO口 …

精品基于Uniapp+ssm英语学习交流平台小程序打卡计划备忘录

《[含文档PPT源码等]精品微信小程序基于Uniappssm英语学习交流平台小程序》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功&#xff01; 软件开发环境及开发工具&#xff1a; 开发语言&#xff1a;Java 后台框架&#xff1a;ssm 安卓框…

Linux_网络项目_WEB服务器 处理服务器写入失败后sigpipe信号导致服务器崩溃退出问题,引入线程池缓解大量请求,服务器组件化重构,在线计算机业务测试

文章目录 1. 处理服务器写入管道出错2. 引入线程池缓解大量请求导致服务器崩溃设计线程任务类单例线程池组件设计 3.代码位置4. 在线计算机业务运行截图 1. 处理服务器写入管道出错 经过测试&#xff0c;服务器在读取报文时如果出错可以选择直接关闭这个TCP里链接来节省资源。…

【深度学习】YOLOv9继续训练——断点训练方法

YOLOv9继续训练主要分为两个情况&#xff1a; 其一、训练过程中意外中断&#xff0c;未完成训练预期的epoch数量&#xff1b; 其二、训练完了&#xff0c;但是未收敛&#xff0c;在这个基础上&#xff0c;还想用这个权重、学习率等参数继续训练多一些轮次 一、训练过程中意外…

PFA容量瓶volumetric flask应用研究分析

容量瓶是一个透明的长颈瓶&#xff0c;瓶体为梨形&#xff0c;便于摇荡液体和刷洗。每一个PFA容量瓶上的刻度线都是用千分之一的电子天平称量、标注&#xff0c;PFA容量瓶以其优异的耐化学腐蚀性和热稳定性&#xff0c;在实验室器皿中占有重要地位。随着科学技术的不断发展&…

腾讯云轻量应用服务器使用全攻略,都在这!

腾讯云轻量应用服务器怎么使用&#xff1f;轻量应用服务器使用包括快速创建轻量服务器、轻量服务器远程连接、使用轻量应用服务器搭建网站教程、轻量服务器开通端口教程等&#xff0c;腾讯云服务器网txyfwq.com整理了关于腾讯云轻量应用服务器的使用教程&#xff0c;目前轻量应…

【五、接口自动化测试】GET/POST 请求区别

大家好&#xff0c;我是山茶&#xff0c;一个探索AI 测试的程序员 在网上看到了许多关于post与get之间区别的帖子&#xff0c;也有很多帖子是直接粘贴复制的&#xff0c;甚至连标题、符号都没改&#xff0c;甚至还有很多争议 一、post、get 关于post与get之间区别&#xff0c;…

FFmpeg工作流程及视频文件分析

FFmpeg工作流程: 解封装(Demuxing)--->解码(Decoding)--->编码(Encoding)--->封装(Muxing) FFmpeg转码工作流程: 读取输入流--->音视频解封装--->解码音视频帧--->编码音视频帧--->音视频封装--->输出目标流 可简单理解为如下流程: 读文件-->解…

基于SpringMVC+JSP实现的亚盛汽车配件销售业绩管理统

采用技术 基于SpringSpringMVCMyBatis框架实现亚盛汽车配件销售业绩管理统的设计与实现~ 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringMVCMyBatis 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 页面展示效果 员工端效果 进货信息 配件管理…

MySQL中ON DUPLICATE KEY UPDATE的介绍与使用、批量更新、存在即更新不存在则插入

文章目录 一、ON DUPLICATE KEY UPDATE的介绍二、ON DUPLICATE KEY UPDATE的使用2.1、案例一&#xff1a;根据主键id进行更新2.2、案例二&#xff1a;根据唯一索引进行更新&#xff08;常用&#xff09;2.3、案例三&#xff1a;没有主键或唯一键字段值相同就插入2.4、案例四&am…