AC自动机(查询)

        上面讲了AC自动机是如何建树和建自动机的,这里要讲的是AC自动机的查询和各个数组的功能和作用。

        其实AC自动机的查询和KMP算法是及其相近的,都是一个指针跑主串,另一个指针跑ne串(这里就是回跳边)。

        话都说到这了,不妨先来看看ne的真实用处吧。上次有提过,ne数组存的其实就是最长的后缀模式串,当我们找到一个字串在主串中匹配的时候,我们并不能直接继续下去,因为如果两个单词之间存在借位的情况,我们就会忽略从而导致错误,所以我们需要记录下当前字母先前能回跳的位置,这样我们才能将我们所要的字串一网打尽,和KMP其实是完全相同的。

        那么转移边呢,我们说过我们要用一个指针去遍历树,但是我们遍历树的时候一但到头了怎么办,是不是要沿着原路反回。现在我们用一个转移边就可以节省这一部分的操作,那么为什么要把转移边建在自己回跳边的儿子上呢?其实是为了契合上面所建的回跳边,这样我们的跑主串的指针就一定会是不回退的,只需要回跳边不断操作,主串完全就是一个匹配版,不需要进行复杂的操作。

        代码如下:

int query(char *s)
{
	int ans = 0;
	
	for(int k = 0, i = 0; s[k]; k ++)
	{
		i = ch[i][s[k] - 'a'];
		
		for(int j = i; j && ~cnt[j]; j = ne[j])
		{
			ans += cnt[j];
			cnt[j] = -1;
		}
	}
	
	return ans;
}

        这里需要注意,我们的计数的维护,当我们找到某一个字串后,我们会加上它在Trie树中存储的个数,同时别忘了清零,否则会多加,这里用的是位运算的小技巧。 

        贴一道例题:

https://www.luogu.com.cn/problem/P3808icon-default.png?t=N7T8https://www.luogu.com.cn/problem/P3808

题目描述

给定 𝑛 个模式串 𝑠𝑖 和一个文本串 𝑡,求有多少个不同的模式串在文本串里出现过。
两个模式串不同当且仅当他们编号不同。

输入格式

第一行是一个整数,表示模式串的个数 𝑛。
第 2 到第 (𝑛+1) 行,每行一个字符串,第 (𝑖+1) 行的字符串表示编号为 𝑖的模式串 𝑠𝑖。
最后一行是一个字符串,表示文本串 𝑡。

输出格式

输出一行一个整数表示答案。

输入输出样例

输入 #1复制

3
a
aa
aa
aaa

输出 #1复制

3

输入 #2复制

4
a
ab
ac
abc
abcd

输出 #2复制

3

输入 #3复制

2
a
aa
aa

输出 #3复制

2

        代码如下:
 

#include <bits/stdc++.h>

using namespace std;

const int N = 1e6 + 10;

int ch[N][26], cnt[N], ne[N];
int n, idx;
char s[N];

void insert(char *s)
{
	int p = 0;
	
	for(int i = 0; s[i]; i ++)
	{
		int j = s[i] - 'a';
		if(!ch[p][j])
			ch[p][j] = ++ idx;
		p = ch[p][j];
	}
	cnt[p] ++;
}

void build()
{
	queue<int> q;
	
	for(int i = 0; i < 26; i ++)
		if(ch[0][i])
			q.push(ch[0][i]);
			
	while(!q.empty())
	{
		int u = q.front();
		q.pop();
		for(int i = 0; i < 26; i ++)
		{	
			int v = ch[u][i]; 
			if(v)
			{
				ne[v] = ch[ne[u]][i];
				q.push(v);
			}
			else
				ch[u][i] = ch[ne[u]][i];
		}
	}
}

int query(char *s)
{
	int ans = 0;
	
	for(int k = 0, i = 0; s[k]; k ++)
	{
		i = ch[i][s[k] - 'a'];
		for(int j = i; j && ~cnt[j]; j = ne[j])
		{
			ans += cnt[j];
			cnt[j] = -1;
		}
	}
	
	return ans;
}

int main()
{
	cin >> n;
	
	while(n --)
	{
		cin >> s;
		
		insert(s);
	}
	
	build();
	
	cin >> s;
	
	int ans = query(s);
	
	cout << ans << endl;
}

        我发现了,其实这些看起来比较难的算法并没有用什么特别高级的东西,大多都是需要动脑想的,只要将各个数组的作用,以及特殊的定义想明白其实还是简单的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/681129.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux C语言学习:数据类型

一、 为什么要引入数据类型 • 计算机中每个字节都有一个地址&#xff08;类似门牌号&#xff09; • CPU通过 地址 来访问这个字节的空间 0x20001103 1 0 0 1 0 0 1 1 0x20001102 1 1 1 0 1 1 1 0 0x20001101 1 1 1 1 0 1 0 1 0x20001100 0 …

南京观海微电子-----555函数信号发生器电路分析

电路图 整个电路的工作过程&#xff1a; 首先&#xff0c;555芯片通过外围电阻电容组成一个多谐振荡器&#xff0c;输出一个方波。 555多谐振荡器输出方波后&#xff0c;经电容C1耦合到由R3&#xff0c;C3组成的积分网络。输出三角波。这也是一个电容充放电的过程&#xff0c…

【Linux系统】进程信号

本篇博客整理了进程信号从产生到处理的过程细节&#xff0c;通过不同过程中的系统调用和其背后的原理&#xff0c;旨在让读者更深入地理解操作系统的设计与软硬件管理手段。 目录 一、信号是什么 1.以生活为鉴 2.默认动作与自定义动作 3.信号的分类、保存、产生 二、产生…

彻底吃透A*算法的最优性

下面的博客将主要介绍A*算法在扩展结点&#xff08;这对于寻路时间很重要&#xff09;和总代价&#xff08;这对于保证最后解的最优性很重要&#xff09;上的最优性&#xff0c;并将淡化对A *完备性的介绍。 A* 算法流程 A*算法的流程如下[1]&#xff1a; 并定义 f ( n ) f(n…

【云原生_K8S系列】Kubernetes 控制器简介

概述 Kubernetes是一个开源的容器编排平台&#xff0c;旨在自动化部署、扩展和管理容器化应用。Kubernetes 的核心组件之一是控制器&#xff08;Controller&#xff09;&#xff0c;它负责确保集群中的实际状态与用户定义的期望状态一致。控制器是 Kubernetes 控制平面的一个重…

GaussDB的数种形态

GaussDB作为一种新兴的关系型数据库产品&#xff0c;似乎有点让人摸不着头脑。有朋友问我GaussDB单机版怎么样&#xff0c;有人说GaussDB是分布式数据库&#xff0c;还有人说它是云数据库&#xff0c;还有人会把GaussDB和华为的数据仓库GaussDB DWS混为一谈。确实&#xff0c;公…

密码学基本概念(补充)

BiBa模型的*特性规则&#xff1a;主体不能修改更高完整级的客体&#xff08;主题不能向上写&#xff09; Diffie-Hellman密钥交换协议的安全性基于求解离散对数的困难性&#xff0c;既对于C^d M mod P&#xff0c;在已知C和P的前提下&#xff0c;由d求M很容易&#xff0c;但是…

取代Windows的系统复制粘贴等文件处理

TeraCopy 可以到官网下载也可以通过应用商店下载 主要作用 : 取代Windows的系统复制粘贴等文件处理 常规窗口 点击第一排最左侧的按钮会显示这个窗口, 显示所以文件操作记录 , 这个也是我装这个软件的原因之一, 框选的是当前正在进行的 当执行复制粘贴时会自动出现, 让自行…

从零开始:如何通过美颜SDK构建自己的直播美颜工具

今天&#xff0c;我将详细介绍如何通过美颜SDK从零开始构建自己的直播美颜工具。 一、了解美颜SDK 什么是美颜SDK 开发者可以通过集成SDK&#xff0c;快速在应用中实现这些功能&#xff0c;而无需从头编写复杂的图像处理算法。 选择合适的美颜SDK 选择时可以根据以下几个方…

RAG 高效应用指南 :Query 理解

前言 构建一个检索增强生成 (Retrieval-Augmented Generation, RAG) 应用的 PoC&#xff08;概念验证&#xff0c;Proof of Concept&#xff09;过程相对简单&#xff0c;但要将其推广到生产环境中则会面临多方面的挑战。这主要是因为 RAG 系统涉及多个不同的组件&#xff0c;…

使用Nginx正向代理让内网主机通过外网主机访问互联网

目录 环境概述 流程说明 在外网服务器上安装部署nginx 安装前准备 下载nginx 编译安装nginx 开始配置正向代理 创建systemd服务单元文件&#xff0c;用于管理Nginx服务的启动、停止和重新加载 启动nginx 代理服务器本地验证 内网服务器验证 将代理地址添加到环境变量中…

38. 【Java教程】日期和时间处理

本小节我们将学习 Java 中的日期和时间&#xff0c;日期和时间在我们的实际开发中非常常用&#xff0c;例如用户的注册、数据的增删改、对敏感信息的操作等等都需要记录下日期和时间。通过本小节的学习&#xff0c;你将了解到什么是日期、什么是时间、什么是时区&#xff0c;Ja…

查看云是基于openstack是哪一个版本开发的?

进入版本发行网站&#xff1a; OpenStack Releases: OpenStack Releases 进入云的后台&#xff0c;查看例如nova的版本号 rpm -qa | grep nova 查看到nova的版本号是21版本&#xff0c;点开releases中例如Ussuri查看nova的版本号&#xff0c;是21&#xff0c;则该云是基于U…

数据分析技术---对比K-means,密度分析和层次聚类性能

一、数据集选择&#xff1a; Iris数据集。 二、实验代码&#xff1a; #对比k-means、密度聚类和层次聚类性能import matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.cluster import KMeans, DBSCAN, AgglomerativeClusteringfrom sklearn.preprocessing i…

STM32自己从零开始实操04:显示电路原理图

一、TFT-LCD 屏接口 1.1指路 以下是该部分的设计出来后的实物图&#xff0c;我觉得看到实物图可能更方便理解这部分的设计。 图1 实物图 这部分设计的是一个屏幕的接口&#xff0c;很简单。使用的屏幕是&#xff1a;2.8inch 16BIT Module MRB2801。 1.2数据手册 &#xff0…

metasploit上线之后可以使用的命令

1. 通用控制命令 meterpreter > essions -k 1 # 通过ID号杀死一个会话 meterpreter > background # 将会话放入后台 meterpreter > getuid/getpid # 查询用户权限与PID meterpreter > sysinfo # 查看目标…

智慧校园教学模式的崛起:优化学习体验

在当今数字化时代&#xff0c;智慧校园教学模式正在成为教育界的热门话题。随着科技的不断发展&#xff0c;传统的教学方式已经无法满足现代学生的需求。智慧校园教学模式以其灵活性、互动性和个性化的特点&#xff0c;正逐渐改变着教育的面貌。 首先&#xff0c;智慧校园教学模…

R_AARCH64_ADR_PREL_PG_HI21问题说明

目录 问题现象&#xff1a; 问题原因 问题机理 问题现象&#xff1a; 客户现场加载out文件出现如下问题&#xff1a; 打印“Relocation of type ‘R_AARCH64_ADR_PREL_PG_HI22…..’”,明确是ARDP指令引起的问题 问题原因 ARDP的寻址范围是4GB范围&#xff0c;加载的位置…

Tomcat概述及部署

目录 一、Tomcat概述 1.Tomcat的简介 2.Tomcat 核心的三个组件 3.应用场景 4.Tomcat 请求过程 二、部署安装Tomcat 三、Tomcat 虚拟主机配置 四、Tomcat多实例部署 一、Tomcat概述 1.Tomcat的简介 Tomcat 是 Java 语言开发的&#xff0c;Tomcat 服务器是一个免费的开…

经验分享,超声波车位引导系统和视频车位引导系统有哪些区别

随着城市化进程的加速和汽车保有量的持续增长&#xff0c;停车难已成为城市交通管理的一大挑战。车位引导系统作为解决这一问题的有效工具&#xff0c;其重要性日益凸显。它不仅能够提升停车场的运营效率&#xff0c;还能显著改善驾驶者的停车体验。目前市场上主要有两种车位引…