字符串前缀哈希法
str = "ABCABCDEHGJK"
预处理每一个前缀的哈希值,如 :
h[0] = 0;
h[1] = "A"的哈希值
h[2] = "AB"的哈希值
h[3] = "ABC"的哈希值
h[4] = "ABCA"的哈希值
问题 :
-
如何定义一个前缀的哈希值 : 将字符串看成一个p进制的数
比如对于字符串 "A B C D" 看成 (1 2 3 4)p
那么转化为10进制就是 : (1p^3+2p^2+3p^1+4p^0)
这个结果会很大,那么就将其模上一个较小的2数 : Q,转换后的范围也就是0-Q-1
这样的话就可以将任意一个字符串映射到0-Q-1之间的一个数;
-
一般情况下,不能把某一个字母映射成0,这样会将多个字符串映射成相同的p进制数,如("A","AA");
-
一般情况下,p取131或13331,Q取2^64,在99%不会发生冲突
-
-
注意 :
-
哈希值用unsigned long long (Q)来存,溢出也就相当于取模了;
-
预处理字符串哈希值 : h[i] = h[i-1]*p+str[i]
-
对于字符串的一段子串[l,r]的哈希值为 : h[r] - h[l]*p^r-l+1;
-
对于字符串左边是高位,右边是低位
题目 : acwing - 841字符串哈希
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式 第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3 aabbaabb 1 3 5 7 1 3 6 8 1 2 1 2
输出样例:
Yes No Yes
代码 :
#include<iostream>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];
ULL get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
scanf("%d%d%s", &n, &m, str + 1);
p[0] = 1;
for(int i = 1; i <= n; i++)
{
p[i] = p[i - 1] * P;
h[i] = h[i - 1] * P + str[i];
}
while(m--)
{
int l1, r1, l2, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if(get(l1, r1) == get(l2, r2)) puts("Yes");
else puts("No");
}
return 0;
}