【C语言】深入理解KMP算法及C语言实现

一、KMP算法简介

 KMP算法(Knuth-Morris-Pratt算法)是一种高效的字符串匹配算法,由Donald Knuth、James H. Morris和 Vaughan Pratt共同发明。KMP算法的核心思想是当一次字符比较失败时,利用已经得到的部分匹配信息,将模式字符串向右滑动一段距离后继续比较,从而避免从头开始匹配,提高匹配效率。

二、KMP算法原理

  1. 前缀和后缀
    KMP算法中,我们关心模式字符串的前缀和后缀。对于模式字符串P,长度为m,我们定义P的前缀为P[0…i](0 <= i < m),后缀为P[j…m-1](0 <= j < m)。如果前缀和后缀相等,我们称这个前缀和后缀为P的一个border。
  2. 部分匹配表(Partial Match Table,PMT)
    KMP算法通过计算模式字符串的一个特殊数组——部分匹配表(PMT),来存储每个位置之前(包括当前位置)的字符串的最长border长度。这个数组也被称为next数组。PMT的计算过程如下:
    (1)初始化PMT数组,令PMT[0] = -1,PMT[1] = 0。
    (2)遍历模式字符串P,对于每个位置i(1 < i < m),找到P[0…i-1]的最长border长度,记为k。如果P[k] == P[i],则PMT[i] = k + 1;否则,继续寻找更短的border,直到找到或k = -1。
  3. KMP匹配过程
    KMP匹配过程如下:
    (1)初始化两个指针i和j,分别指向主字符串S和模式字符串P的起始位置。
    (2)遍历主字符串S,对于每个位置i,进行如下操作:
    a. 如果P[j] == S[i],则i和j分别指向下一个位置,继续比较。
    b. 如果P[j] != S[i],则利用PMT数组,将j移动到PMT[j]的位置,继续比较。
    c. 如果j移动到模式字符串的起始位置,则i指向下一个位置。
    (3)如果j指向模式字符串的末尾,说明匹配成功,返回匹配的起始位置;否则,匹配失败,返回-1。

请添加图片描述

三、C语言实现

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

// 计算部分匹配表(PMT)
void computePMT(char *P, int *PMT) {
    int m = strlen(P); // 模式串的长度
    PMT[0] = -1; // PMT数组的第一个元素设为-1
    PMT[1] = 0; // PMT数组的第二个元素设为0
    int k = 0; // 初始化k为0,用于PMT的计算

    // 计算PMT数组
    for (int i = 2; i < m; i++) {
        // 如果当前字符不匹配,并且k不为0,则回退k的位置
        while (k > 0 && P[k] != P[i - 1]) {
            k = PMT[k];
        }
        // 如果当前字符匹配,则k增加1
        if (P[k] == P[i - 1]) {
            k++;
        }
        PMT[i] = k;
    }
}

// KMP搜索算法
int KMP(char *S, char *P) {
    int n = strlen(S); // 主串的长度
    int m = strlen(P); // 模式串的长度
    int *PMT = (int *)malloc(m * sizeof(int)); // 动态分配PMT数组的空间
    computePMT(P, PMT); // 计算PMT数组

    int i = 0, j = 0; // 初始化i和j,分别用于主串和模式串的索引
    // 遍历主串S
    while (i < n) {
        // 如果j为-1或当前字符匹配,则继续匹配下一个字符
        if (j == -1 || S[i] == P[j]) {
            i++;
            j++;
        } else {
            // 如果字符不匹配,则根据PMT数组回退j的位置
            j = PMT[j];
        }
        // 如果j等于模式串的长度,则找到了匹配
        if (j == m) {
            free(PMT); // 释放PMT数组的空间
            return i - j; // 返回匹配的起始索引
        }
    }
    free(PMT); // 释放PMT数组的空间
    return -1; // 如果没有找到匹配,则返回-1
}

int main() {
    char S[] = "ababcabcafgghrfthrhrthrtjtyjcbab"; // 主串
    char P[] = "rhrthrtj"; // 模式串
    int index = KMP(S, P); // 使用KMP算法搜索模式串在主串中的位置

    // 输出结果
    if (index != -1) {
        printf("Pattern found at index %d\n", index);
    } else {
        printf("Pattern not found\n");
    }
    return 0;
}

运行结果:

在这里插入图片描述

四、总结

KMP算法是一种高效的字符串匹配算法,通过计算模式字符串的部分匹配表(PMT),在匹配过程中利用已匹配的信息,避免了不必要的重复比较,提高了匹配效率。本文通过C语言实现KMP算法,帮助读者更好地理解KMP算法的原理和实现过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/573662.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Kubernetes TDengine 系列|安装 TDengine 的 Grafana 插件|Grafana监控TDengine数据

为了让Grafana 能够监控到TDengine 数据&#xff0c;快速集成搭建数据监测报警系统&#xff0c;所以直接安装TDengine 插件。 目录 一、安装 TDengine 的 Grafana 插件1、下载TDengine grafana插件2、解压到指定目录3、配置未签名插件 二、配置数据源&#xff0c;简单查询TDen…

想在游泳健身的同时畅听音乐,随时哈氪漫游这款IP68防水的骨传导耳机

平时健身的过程中&#xff0c;音乐是许多健身爱好者的忠实伴侣。无论是在室内的健身房&#xff0c;还是户外的自然风光中&#xff0c;一副优质的耳机可以极大地提升我们的锻炼体验。现在市面上专为运动设计的耳机选择非常多&#xff0c;我喜欢用骨传导耳机&#xff0c;目前在用…

Linux--忘记root密码解决办法

Linux忘记密码解决的方法有两种&#xff1a; 方法一&#xff1a; 第一步&#xff1a;打开虚拟机时&#xff0c;疯狂按方向键&#xff0c;让该虚拟机不进入系统停留在开机界面&#xff0c;按方向键使光标停留在第一行&#xff0c;按字母E编辑它&#xff0c;如 按E后&#xff0…

数据结构 - 链表详解(二)—— 带头双向循环链表

链表的介绍 链表的结构一共有八种&#xff1a;带头单向循环链表、带头单向非循环链表、带头双向循环链表、带头双向非循环链表、无头单向循环链表、无头单向非循环链表、无头双向循环链表、无头双向非循环链表。 今天我们来详解带头双向循环链表 带头双向循环链表是一种数据结…

2024深圳杯C题的8页思路分析+所有代码可执行+参考文献+持续更新参考论文(已经更新了代码与图像)

比赛题目的完整版思路可执行代码数据参考论文都会在第一时间更新上传的&#xff0c;大家可以参考我往期的资料&#xff0c;所有的资料数据以及到最后更新的参考论文都是一次付费后续免费的。注意&#xff1a;&#xff08;建议先下单占坑&#xff0c;因为随着后续我们更新资料数…

用ESP32的ADC引脚,结合分压电路测量电压

该代码基于ESP32&#xff08;Arduino库&#xff09;实现ADC&#xff08;模拟数字转换器&#xff09;数据采集。它配置ADC参数、获取校准特性&#xff0c;循环采样并计算平均值&#xff0c;将ADC读数转换为电压&#xff0c;考虑分压电阻影响&#xff0c;计算实际电压值&#xff…

【论文复现】时间协同制导算法

一、背景部分 如需了解请看李康博士关于该论文背景简介&#xff1a;基于一致性算法的分布式时间协同制导律 - 知乎 (zhihu.com) 论文链接&#xff1a;Distributed Cooperative Guidance for Multivehicle Simultaneous Arrival Without Numerical Singularities (westlake.ed…

Pandas Series显式切片和隐式切片大揭秘

Pandas Series在Python的数据处理中扮演着非常重要的角色。它是一维数组&#xff0c;可以容纳任何数据类型&#xff08;整数、字符串、浮点数、Python对象等&#xff09;&#xff0c;并且提供了大量的方法来进行数据操作和分析。Pandas Series的切片操作是其核心功能之一&#…

colab直接下载kaggle数据集

1.获取kaggle API Token account-settings-API&#xff0c;这时候会下载一个kaggle.json&#xff0c;然后将里面的内容{username:.......}复制一份 &#xff08;个人怕之后找不到另外放了一份到Google云端硬盘中&#xff09; 2.在colab中绑定kaggle !pip install -U -q kagg…

技术实践|大模型内容安全蓝军的道与术

1、引子 大语言模型&#xff08;LLM&#xff09;在2023年大放异彩&#xff0c;在许多领域展现出强大的能力&#xff0c;包括角色扮演&#xff0c;文本创作&#xff0c;逻辑推理等。然而&#xff0c;随着其应用范围的扩大&#xff0c;生成内容的安全问题也日益凸显。这包括但不…

el-upload组件如何上传blob格式的url地址视频

el-upload组件如何上传blob格式的url地址视频 一、存在问题二、直接上代码 需求&#xff1a;想把视频地址url:“blob:http://localhost:8083/65bd3c0f-52ec-4844-b85e-06fdb5095b7b”&#xff0c;通过el-upload组件上传 el-upload是Element UI中用于文件上传的组件&#xff0c;…

如何开启kali的ssh远程连接

1.打开配置文件 vim /etc/ssh/sshd_config 将第13行和32改为如下&#xff0c;保存退出 重启服务 sudo systemctl restart ssh.service 使用远程工具&#xff08;如xshell&#xff09;即可连接 如果无法连接&#xff0c;需要先生成两个密钥&#xff1a;ssh-keygen -t dsa -f…

【14-Ⅱ】Head First Java 学习笔记

HeadFirst Java 本人有C语言基础&#xff0c;通过阅读Java廖雪峰网站&#xff0c;简单速成了java&#xff0c;但对其中一些入门概念有所疏漏&#xff0c;阅读本书以弥补。 第一章 Java入门 第二章 面向对象 第三章 变量 第四章 方法操作实例变量 第五章 程序实战 第六章 Java…

每周一算法:最短路计数

题目描述 给出一个 N N N个顶点 M M M 条边的无向无权图&#xff0c;顶点编号为 1 1 1 到 N N N。 问从顶点 1 1 1 开始&#xff0c;到其他每个点的最短路有几条。 输入格式 第一行包含 2 2 2 个正整数 N , M N,M N,M&#xff0c;为图的顶点数与边数。 接下来 M M …

Linux基础命令[25]-groupadd

文章目录 1. groupadd 命令说明2. groupadd 命令语法3. groupadd 命令示例3.1 不加参数3.2 -f&#xff08;强制创建&#xff09;3.3 -g&#xff08;指定组ID&#xff09;3.4 -r&#xff08;系统用户组&#xff09; 4. 总结 1. groupadd 命令说明 groupadd&#xff1a;用于创建…

C语言入门课程学习记录4

C语言入门课程学习记录4 第18课 - signed 与 unsigned第19课 - 再论数据类型第20课 - 经典问题剖析第21课 - 程序中的辅助语句&#xff08;上&#xff09;第22课 - 程序中的辅助语句&#xff08;下&#xff09; 本文学习自狄泰软件学院 唐佐林老师的 C语言入门课程&#xff0c;…

【C++】:拷贝构造函数和赋值运算符重载

目录 一&#xff0c;拷贝构造函数1. 什么是拷贝构造函数2. 拷贝构造函数的特性3. 实践总结 二&#xff0c;赋值运算符重载2.1 运算符重载2.2 赋值运算符重载 一&#xff0c;拷贝构造函数 1. 什么是拷贝构造函数 拷贝构造函数是特殊的构造函数。是用一个已经存在的对象&#x…

JVM虚拟机监控及性能调优实战

目录 jvisualvm介绍 1. jvisualvm是JDK自带的可以远程监控内存&#xff0c;跟踪垃圾回收&#xff0c;执行时内存&#xff0c;CPU/线程分析&#xff0c;生成堆快照等的工具。 2. jvisualvm是从JDK1.6开始被继承到JDK中的。jvisualvm使用 jvisualvm监控远程服务器 开启远程监控…

软考高级 | 系统架构设计师笔记(一)

一. 系统规划 1.1 项目的提出与选择 该步骤生成” 产品/项目建议书”. 1.2 可行性研究与效益分析 包括经济可行性/技术可行性/法律可行性/执行可行性/方案选择 5 个部分. 该步骤生 成”可行性研究报告”. 1.3 方案的制订和改进 包括确定软件架构/确定关键性要素?/确定计算…

java Web-Spring AOP

AOP的概念 AOP:面向切面编程&#xff0c;面向方法编程。简单理解就是对特定方法的扩充的思想 例如我们要在特定方法进行方法的执行时间判断&#xff0c;我们假如去使用在每个方法去进行业务逻辑扩充&#xff0c;这样就太繁琐了&#xff0c;而使用AOP就可以简化操作。Spring A…