力扣刷题总结 字符串(2)【KMP】

🔥博客主页: A_SHOWY
🎥系列专栏:力扣刷题总结录 数据结构  云计算  数字图像处理    

28.找出字符串中第一个匹配项的下标mid经典KMP
4593重复的子字符串mid可以使用滑动窗口或者KMP

KMP章节难度较大,需要深入理解其中的底层原理,单纯背代码不可靠

一、KMP方法总结

(1)KMP能解决的问题

KMP主要应用在字符串匹配上

(2)前缀和后缀

前缀:包含首字母不包含尾字母的所有子串

例如:

字符串aabaaf
前缀: a
      aa
      aab
      aaba
      aabaa
      aabaaf ×

后缀:包含尾字母而不包含首字母的所有子串

字符串aabaaf
后缀: f
      af
      aaf
      baaf
      abaaf
      aabaaf ×

(3)最长相等的前后缀 

模式串的前缀表

字符串aabaaf
最长相等前后缀:
a      0
aa     1
aab    0
aaba   1
aabaa  2
aabaaf 0
所以前缀表是010120

所以要跳到最长的相等前后缀的后面去接着匹配

(4)前缀表原理

模式串与前缀表对应位置的数字表示的是:下标i之前的字符串中,有多大长度的相同前后缀,所以当找到不匹配的位置时,要看前一个字符的前缀表的数值,因为要找前一个字符的最长相同的前后缀,前一个字符的前缀表的数值是2, 所以把下标移动到下标2的位置继续比配。next(prefix)数组:遇到冲突后,要回退到的下一个位置

最重要的一点(理解KMP的核心)为什么使用前缀表可以告诉我们匹配失败之后跳到哪里重新匹配?

假设在下标为5的部分不匹配了,下标5之前的这部分字符串最长相等的前后缀是aa,找到了最长的相等前后缀,匹配失败的地方是后缀子串的后面,那么找到与其相等的前缀部分就可以继续匹配了。

(5)前缀表代码实现

1.求next数组方式有很多 (比如原封不动【如果遇到冲突了,就找这个前缀表数组的前一位作为下标】,有的全部右移【初始值为-1,冲突这个位置对应下标】,有的全部减去1【不推荐 】),但是next数组的核心是遇到冲突了要向前回退

2.i指向了后缀末尾,j指向了前缀末尾,还代表i(包括i)之前的子串的最长相等前后缀的长度(这里难点就是j的双层含义),他非常像一个递归的过程

3.具体步骤可以分为四步:初始化 讨论处理前后缀不相同的时候 处理前后缀相同的时候 给next数组赋值,就能得到模式串的前缀表

  • 首先是初始化,对于 i和j的初始化以及next【0】的初始化,那么j我们初始化为-1,前面提到这只是其中的一种表现形式也就是串整体右移,那么i选择1(i肯定不能是0),next【i】表示i之前最长前后缀的长度,其实也就是j对于i的初始化我们放在后边的循环里
int j = -1;
next[0] = j;
  • 其次就是讨论前后缀不相同的情况,比较s【i】和s【j+1】是否相同,如果不同,那么就要回退,由于next【j】记录着j之前子串相同前后缀的长度,就要找j+1前一个元素在next数组的值(next【j】),注意向前回退是一个持续的过程,所以用while如果不匹配就一直回退
for(int i = 0; i < s.size(); s++){
while(j>=0 && s[i] != s[j+1]){
      //向前回退
       j = next[j];
}
}
  • 然后处理前后缀相同的情况,如果s【i】和s【j+1】相同,,就要同时移动i和j,并且,讲j赋值给next【i】
if (s[i] == s[j + 1]) { // 找到相同的前后缀
    j++;
}
next[i] = j;

 所以完整版本的 代码如下:

void getNext(int* next, const string& s){
    int j = -1;
    next[0] = j;
    for(int i = 1; i < s.size(); i++) { // 注意i从1开始
        while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
            j = next[j]; // 向前回退
        }
        if (s[i] == s[j + 1]) { // 找到相同的前后缀
            j++;
        }
        next[i] = j; // 将j(前缀的长度)赋给next[i]
    }
}

二、经典题目

(1)28.找出字符串中第一个匹配项的下标

28. 找出字符串中第一个匹配项的下标icon-default.png?t=N7T8https://leetcode.cn/problems/find-the-index-of-the-first-occurrence-in-a-string/其实这个题目可以分成两个部分,是一个经典的字符串匹配题目,肯定是用我们刚刚学过的KMP算法来完成。那么所谓分成两个部分解体,第一部分就是构造NEXT数组,第二部分就是运用这个前缀表进行一个匹配的问题,那么第一部分的构造前缀表(NEXT数组)已经写完了,下面我们来写匹配过程的代码。注意我们一直用的是全体-1操作后的NEXT数组,在文本串haystack里面查找是否出现过模式串needle。

 int strStr(string haystack, string needle) {

      int j = -1;
      int next[needle.size()];
      getNext(next,needle);
      for(int i = 0; i< haystack.size();i++)//匹配过程中,next数组的使用从索引0开始
    {
        while(j >= 0 && haystack[i] != needle[j+1]){
            j = next[j];
        }
        if(haystack[i] == needle[j+1]){
            j++;
        }
        if(j == needle.size() -1){//j到了末尾
            return (i-needle.size() +1);//返回首部
        }
    }
    return -1;
    }

这里有几个要注意的点,第一个是i的初始值,匹配过程中,next数组的使用从索引0开始,在构造next数组的时候,0已经给了初始值了,所以从1开始。

然后就是如何判断是否包含呢,当i走到了needle的末尾的时候,说明存在匹配,返回首部的数值即可,所以完整的代码实现为

class Solution {
public:
void getNext(int* next, string& s){
    int j = -1;
    next[0] = j;//初始化
    for(int i =1; i < s.size();i++)//初始化,i从1开始
    {
        while(j >= 0 && s[i] != s[j+1]){//如果不想等
            j = next[j];//j就回退,这里有点像递归
        }
        if(s[i] == s[j+1]){
            j++;
        }
        next[i] = j;//最后给next数组的i坐标赋值
    }
}
    int strStr(string haystack, string needle) {

      int j = -1;
      int next[needle.size()];
      getNext(next,needle);
      for(int i = 0; i< haystack.size();i++)//匹配过程中,next数组的使用从索引0开始
    {
        while(j >= 0 && haystack[i] != needle[j+1]){
            j = next[j];
        }
        if(haystack[i] == needle[j+1]){
            j++;
        }
        if(j == needle.size() -1){//j到了末尾
            return (i-needle.size() +1);//返回首部
        }
    }
    return -1;
    }
};

(2)459.重复的子字符串

459. 重复的子字符串icon-default.png?t=N7T8https://leetcode.cn/problems/repeated-substring-pattern/

方法一:滑动窗口

当一个字符串内部由重复的子串组成,也就是由前后相同的子串组成。那么既然前面有相同的子串,后面有相同的子串,用 s + s,这样组成的字符串中,后面的子串做前串,前面的子串做后串,就一定还能组成一个s。

所以总体的思路为(个人认为很神奇的思路):只要两个s拼接在一起,里面还出现一个s的话,就说明是由重复子串组成。但是注意要去除s+s的字符串的首尾位置,不然判断没有意义。

class Solution {
public:
    bool repeatedSubstringPattern(string s) {
     string t = s + s;
     //掐头去尾
     t.erase(t.begin());
     t.erase(t.end() -1);//注意是end-1,应为t.end,返回指向t末尾下一个位置的迭代器
     if(t.find(s) != std::string::npos)//指的是字符串中未找到指定内容时的特殊返回值
     return true;
     return false;
    }
};

方法二:KMP算法

为什么可以使用KMP

步骤一:因为 这是相等的前缀和后缀,t[0] 与 k[0]相同, t[1] 与 k[1]相同,所以 s[0] 一定和 s[2]相同,s[1] 一定和 s[3]相同,即:,s[0]s[1]与s[2]s[3]相同 。

步骤二: 因为在同一个字符串位置,所以 t[2] 与 k[0]相同,t[3] 与 k[1]相同。

步骤三: 因为 这是相等的前缀和后缀,t[2] 与 k[2]相同 ,t[3]与k[3] 相同,所以,s[2]一定和s[4]相同,s[3]一定和s[5]相同,即:s[2]s[3] 与 s[4]s[5]相同。

步骤四:循环往复。

结论:在由重复子串组成的字符串中,最长前后缀不包含的子串就是最小重复子串

最长相等前后缀的长度为:next[len - 1] + 1。(这里的next数组是以统一减一的方式计算的,因此需要+1,如果len % (len - (next[len - 1] + 1)) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。 (仍然是很神奇的思路)

class Solution {
public:
    void getNext (int* next, const string& s){
        next[0] = -1;
        int j = -1;
        for(int i = 1;i < s.size(); i++){
            while(j >= 0 && s[i] != s[j + 1]) {
                j = next[j];
            }
            if(s[i] == s[j + 1]) {
                j++;
            }
            next[i] = j;
        }
    }
    bool repeatedSubstringPattern (string s) {
        if (s.size() == 0) {
            return false;
        }
        int next[s.size()];
        getNext(next, s);
        int len = s.size();
        if (next[len - 1] != -1 && len % (len - (next[len - 1] + 1)) == 0) {
            return true;
        }
        return false;
    }
};

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/233165.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Uncaught SyntaxError: Unexpected end of input (at manage.html:1:21) 的一个解

关于Uncaught SyntaxError: Unexpected end of input (at manage.html:1:21)的一个解 问题复现 <button onclick"deleteItem(${order.id},hire,"Orders")" >delete</button>报错 原因 函数参数的双引号和外面的双引号混淆了&#xff0c;改成…

数据可视化|jupyter notebook运行pyecharts,无法正常显示“可视化图形”,怎么解决?

前言 本文是该专栏的第39篇,后面会持续分享python数据分析的干货知识,记得关注。 相信有些同学在本地使用jupyter notebook运行pyecharts的时候,在代码没有任何异常的情况下,无论是html还是notebook区域,都无法显示“可视化图形”,界面区域只有空白一片。遇到这种情况,…

精选Axure原型设计模板,RP原型组件库(PC端移动端元件库及Axure函数及运算符说明)

好的原型组件会大大的提高产品经理的工作效率&#xff0c;小7在陆续整理、精选Axure 8的原型设计模板&#xff0c;包含了原型设计的常用元素和AxureRP 8函数及运算符的说明文档&#xff0c;及各种设备模板框架。 本文也是基于小7另一篇文章的补充&#xff0c;更多更详细的资料…

ffprobe命令行超详细使用详解

本文做为阅读ffprobe源码的前课程。为了之后方便理解ffprobe的源码,咱们先从ffprobe的命令学习。 课程内容如下: 文章目录 一、ffprobe主要选项说明1、每次使用ffprobe都打印编译环境的信息,太烦了2、如何分析媒体文件中存在的流信息3、如何指定查询某路流信息4、查看输入文…

2020年第九届数学建模国际赛小美赛B题血氧饱和度的变异性解题全过程文档及程序

2020年第九届数学建模国际赛小美赛 B题 血氧饱和度的变异性 原题再现&#xff1a; 脉搏血氧饱和度是监测患者血氧饱和度的常规方法。在连续监测期间&#xff0c;我们希望能够使用模型描述血氧饱和度的模式。   我们有36名受试者的数据&#xff0c;每个受试者以1 Hz的频率连…

基于ssm人力资源管理系统论文

摘 要 随着企业员工人数的不断增多&#xff0c;企业在人力资源管理方面负担越来越重&#xff0c;因此&#xff0c;为提高企业人力资源管理效率&#xff0c;特开发了本人力资源管理系统。 本文重点阐述了人力资源管理系统的开发过程&#xff0c;以实际运用为开发背景&#xff0…

Qt开发 之 记一次安装 Qt5.12.12 安卓环境的失败案例

文章目录 1、安装Qt2、安卓开发的组合套件2.1、CSDN地址2.2、官网地址2.3、发现老方法不适用了 3、尝试用新方法解决3.1、先安装JDK&#xff0c;搞定JDK环境变量3.1.1、安装jdk3.1.2、确定jdk安装路径3.1.3、打开系统环境变量配置3.1.4、配置系统环境变量3.1.5、验证JDK环境变量…

OrangePi ZERO2 刷机与启动

镜像准备 用读卡器和Win32Diskimager刷写镜像到内存卡&#xff0c;镜像文件见下面百度云链接&#xff1a;https://pan.baidu.com/s/14aKTznc4Jvw4SoFF54JUTg 提取码&#xff1a;1815 刷写完毕后插回香橙派 串口登录 用MobaXterm和USB-TTL进行串口登录&#xff0c;MobaXterm软…

线程安全3--wait和notify

文章目录 wait and notify&#xff08;等待通知机制notify补充 wait and notify&#xff08;等待通知机制 引入wait notify就是为了能够从应用层面上&#xff0c;干预到多个不同线程代码的执行顺序&#xff0c;这里说的干预&#xff0c;不是影响系统的线程调度策略&#xff08…

持续集成交付CICD:Jenkins流水线实现Nexus制品晋级策略

目录 一、理论 1.开发测试运维环境 二、实验 1.Nexus制品晋级策略 一、理论 1.开发测试运维环境 &#xff08;1&#xff09;环境 1&#xff09;持续集成开发环境&#xff08;DEV: Development Environment&#xff09; 直接通过源代码编译打包&#xff0c;其会跑单元测试…

C# | 使用AutoResetEvent和ManualResetEvent进行线程同步和通信

使用AutoResetEvent和ManualResetEvent进行线程同步和通信 文章目录 使用AutoResetEvent和ManualResetEvent进行线程同步和通信介绍AutoResetEventManualResetEvent 异同点使用场景和代码示例AutoResetEvent 使用示例ManualResetEvent 使用示例阻塞多个线程并同时激活 介绍 在…

fl studio2024官方体验版如何破解?

fl studio2024全称Fruity Loops Studio2024&#xff0c;这款软件也被人们亲切的称之为水果&#xff0c;它是一款功能强大的音乐创作编辑软件&#xff0c;拥有全功能的录音室&#xff0c;大混音盘以及先进的音乐制作工具&#xff0c;用户通过使用该软件&#xff0c;就可以轻松制…

MySQL的锁机制

1.简介 MySQL的隔离性是由锁机制来保证的。锁是计算机协调多个进程或线程并发地访问某一资源你的机制。当多线程并发地访问某个数据时&#xff0c;尤其是在涉及金钱等安全敏感性数据的时候&#xff0c;需要保证数据在任意时刻最多只有一个线程可以对其进行修改&#xff0c;从而…

class070 子数组最大累加和问题与扩展-上【算法】

class070 子数组最大累加和问题与扩展-上【算法】 code1 53. 最大子数组和 // 累加和最大子数组和 // 给你一个整数数组 nums // 请你找出一个具有最大累加和的非空子数组 // 返回其最大累加和 // 测试链接 : https://leetcode.cn/problems/maximum-subarray/ dp[i]&#xff…

Aloha 机械臂的学习记录2——AWE:AWE + ACT

继续下一个阶段&#xff1a; Train policy python act/imitate_episodes.py \ --task_name [TASK] \ --ckpt_dir data/outputs/act_ckpt/[TASK]_waypoint \ --policy_class ACT --kl_weight 10 --chunk_size 50 --hidden_dim 512 --batch_size 8 --dim_feedforward 3200 \ --n…

如何轻松恢复 Windows 中删除的文件夹

我们都曾经历过这样的事&#xff0c;而且我们中的大多数人可能很快就会再次这样做。我们讨论的是在 Windows 中按“Delete”或“ShiftDelete”键意外删除重要文件夹的情况。 如果您刚刚按下删除键且未超过 30 天&#xff0c;或者尚未清空回收站&#xff0c;则可以恢复文件夹。…

uniapp获取wifi连接状态

当使用Uniapp开发移动应用时&#xff0c;我们经常需要获取设备的连接状态&#xff0c;特别是WiFi连接状态。下面是一个简短的关于在Uniapp中获取WiFi连接状态的博客&#xff1a; 在Uniapp中&#xff0c;要获取设备的WiFi连接状态&#xff0c;我们可以利用uni.getNetworkType接…

统信UOS_麒麟KYLINOS上跨架构下载离线软件包

原文链接&#xff1a;统信UOS/麒麟KYLINOS上跨架构下载离线软件包 hello&#xff0c;大家好啊&#xff0c;今天给大家带来一篇在统信UOS/麒麟KYLINOS上跨架构下载离线软件包的实用教程。在我们的日常工作中&#xff0c;可能会遇到这样的情况&#xff1a;需要为不同架构的设备下…

键盘打字盲打练习系列之反复练习——3

一.欢迎来到我的酒馆 盲打&#xff0c;反复练习&#xff01; 目录 一.欢迎来到我的酒馆二.数字&符号键位指法1.数字键位指法2.符号键位指法 三.反复练习 二.数字&符号键位指法 前面的一个章节重点介绍了主键盘区字母键位的指法&#xff1a;基准键位指法、" QWERTY…

WireShark监控浏览器登录过程网络请求

软件开发中经常前后端扯皮。一种是用Chrome浏览器的开发者工具 来看网络交互&#xff0c;但是前提是 网络端口的确是通的。 WireShark工作在更低层。 这个工具最大的好处&#xff0c;大家别扯皮&#xff0c;看网络底层的log&#xff0c;到底 你的端口开没开&#xff0c; 数据…