4261.孤独的照片
AcWing 4261. 孤独的照片(每日一题) - AcWing |
---|
难度:简单 |
时/空限制:1s / 64MB |
总通过数:9889 |
总尝试数:26088 |
来源: USACO 2021 December Contest Bronze |
算法标签 贡献法乘法原理 |
题目内容
Farmer John 最近购入了 N 头新的奶牛,每头奶牛的品种是更赛牛(Guernsey)或荷斯坦牛(Holstein)之一。
奶牛目前排成一排,Farmer John 想要为每个连续不少于三头奶牛的序列拍摄一张照片。
然而,他不想拍摄这样的照片,其中只有一头牛的品种是更赛牛,或者只有一头牛的品种是荷斯坦牛——他认为这头奇特的牛会感到孤立和不自然。
在为每个连续不少于三头奶牛的序列拍摄了一张照片后,他把所有「孤独的」照片,即其中只有一头更赛牛或荷斯坦奶牛的照片,都扔掉了。
给定奶牛的排列方式,请帮助 Farmer John 求出他会扔掉多少张孤独的照片。
如果两张照片以不同位置的奶牛开始或结束,则认为它们是不同的。
输入格式
输入的第一行包含 N。
输入的第二行包含一个长为 N 的字符串。如果队伍中的第 i 头奶牛是更赛牛,则字符串的第 i 个字符为 G
。否则第 i 头奶牛是荷斯坦牛,该字符为 H
。
输出格式
输出 Farmer John 会扔掉的孤独的照片数量。
数据范围
3≤N≤5×10^5
输入样例:
5
GHGHG
输出样例:
3
样例解释
这个例子中的每一个长为 3 的子串均恰好包含一头更赛牛或荷斯坦牛——所以这些子串表示孤独的照片,并会被 Farmer John 扔掉。
所有更长的子串(GHGH
、HGHG
和 GHGHG
)都可以被接受。
题目解析
贡献法
是一个数学思想,在枚举一些数的时候,有些枚举可能比较难算,可能换一种枚举方式比较好算
比如要统计矩阵里面所有数的和
如果按行统计比较复杂,按列统计比较简单,就按列统计
换一种统计的方式,就叫贡献法
看每一列对答案的贡献是什么
按行去统计的话,就是计算每一行它所有数的和
按列去统计的话,就是计算每一列所有数的和,再相加
第i列的总和,可以看成是第i列对整个总和的贡献
- 购入了N头牛,每头牛是更赛牛或荷斯坦牛
- 所有牛排成一排
- 枚举其中所有连续的不少于三头牛的区间,区间的数量是 O ( N 2 ) O(N^2) O(N2)
- 判断其中有多少个区间,里边有一种牛只有一头,有孤独的牛的话,就要扔掉
统计一共有多少张照片是孤独的,统计多少个区间里边,某一个字符只出现一次
N是50万,所以需要将时间复杂度控制在 O ( n log 2 n ) O(n\log_{2}n) O(nlog2n)级别
暴力枚举
根据题目直接算的话,可以先去枚举所有区间,要枚举起点和终点,就是
O
(
n
2
)
O(n^2)
O(n2)级别
再统计区间内的每一个字符的出现次数
O
(
n
)
O(n)
O(n)
过不去
换一种观察角度
在矩阵里边,如果每个区间是以行的话,牛如果是列的话,每一个区间里面如果相片是孤独的话,它一定对应一条唯一的孤独的牛,
所以每一个孤独的区间,跟一头牛是一一对应的
**切入点:**孤独区间一定会对应一头孤独的牛
但是一头牛不一定只对应一个区间
想统计孤独区间的数量的话,
如果暴力,先枚举区间,再去找孤独的牛
如果区间是行的话,有
O
(
n
2
)
O(n^2)
O(n2)级别个,在这
O
(
n
2
)
O(n^2)
O(n2)级别个中去找出所有孤独的区间的话:
如果第一个区间是孤独的区间,其中一定会存在一头孤独的牛,在孤独的牛这里标记为1,其余的牛都写成0
这样如果想统计孤独区间的数量,就可以换一种角度去统计,可以按列去统计,
统计一下第一头牛是多少个孤独区间的那一头孤独的牛,就是统计第一头牛对答案的贡献,
0 | 0 | 0 | 1 | 0 | 0 |
---|---|---|---|---|---|
1 | 0 | 0 | 0 | 0 | 0 |
0 | 0 | 0 | 0 | 1 | 0 |
1 | 0 | 0 | 0 | 0 | 0 |
0 | 0 | 0 | 1 | 0 | 0 |
如果第一头牛在两个区间里面是孤独的牛,就认为第一头牛对答案的贡献是2,第二头牛是0,第三头牛是0,第四头牛是2
这样子也可以把答案统计出来
时间复杂度可以做一些优化
假设改去枚举牛的话
一旦牛确定了,考虑一下一共有多少个区间是以这头牛为核心的孤独的区间
要考虑的区间肯定要包含这头牛,这个区间的左端点一定要在这头牛的左边,右端点应该在这头牛的右边,如果这头牛是孤独的牛的话,那么它的左右边一定是与它相对的那些牛
所有这样的区间要有多少个呢
这种统计次数是可以优化的,先统计一下左边有多少个连续的数量L,再统计一下右边连续的数量R,有了这个信息之后,如何去计算有多少个区间包含这头牛,且这头牛是孤独的且这头牛只出现一次
将所有的区间分成三大类
-
左右两边都各自至少有一个H,加上中间这个G的话,长度就大于等于3了
可以发现,这样的话一定可以满足区间长度大于等于3,是合法的。这类区间的数量有多少个呢,左边相当于画挡板,左边有多少个H就可以画多少个挡板,右边有多少个H可以画多少种挡板,左右两边是独立的。因此这类区间的数量,就是左边H的数量乘以右边H的数量,也就是L*R
,可以直接算
-
左边无H,右边至少有两个H,因为区间长度要大于等于3
这类区间的数量,如果右边H的数量是R个的话,除了第一个H不能画分隔板之外,后面的每一个H都可以右边画一个分隔板,因此第二类区间的数量应该是R-1
隔板就是指右端点
-
右边无H,左边至少有两个H,同理这类区间的数量是L-1
可以发现,枚举完孤独的牛之后,只需要能够快速的预处理出来左边连续的跟它不一样的牛的数量,以及每头牛右边连续的跟它不一样的牛的数量,就可以用 O ( 1 ) O(1) O(1)的时间计算出来这一列有多少个1,也就是计算出来有多少个包含这头牛且以这头牛为孤独的牛的区间的数量有多少个,这样时间复杂度 O ( n ) O(n) O(n),就可以过了
如何快速地预处理L和R,快速地计算一个字符左边有多少个连续的跟它不一样的字符
以预处理L为例,从前往后枚举,
在枚举的时候,比如孤独的牛是G的话,要看它左边连续的H的数量,如果是H的话,看它左边连续G的数量,在从前往后推的时候,只要记录一下到目前为止,连续的G的数量跟连续的H的数量就可以了,
可以动态更新
- 如果孤独的牛是G的话,G左边连续的H的数量, S H S_{H} SH,
- 如果是H的话,左边连续G的数量就是
S
G
S_{G}
SG,
在每次枚举的时候要动态更新一下 S H 和 S G S_{H}和S_{G} SH和SG,
- 如果枚举到H的话,表示 S H + + S_{H}++ SH++,因为这里是H,G没有,所以 S G = 0 S_{G}=0 SG=0
- 如果枚举到G的话,
S
G
+
+
,
S
H
=
0
S_{G}++,S_{H}=0
SG++,SH=0
所以L是可以通过 O ( n ) O(n) O(n)的预处理算出来,
R的话倒过来预处理就可以了,也是 O ( n ) O(n) O(n)的,这样整个算法的时间复杂度就是 O ( n ) O(n) O(n)的
答案有可能爆int,因为是 N 2 N^2 N2级别
贡献法其实就是换一种枚举的角度,矩阵是为了方便理解
如果先枚举区间再枚举牛是
O
(
n
2
)
O(n^2)
O(n2)的,如果先枚举牛再枚举区间的话就变成
O
(
n
)
O(n)
O(n)了
代码
#include <iostream>
#include <cstring>
#include <algorithm>
typedef long long LL;
using namespace std;
const int N = 500010;
int n;
char str[N];
int l[N], r[N];
int main()
{
//先预处理L
scanf("%d%s", &n, str);
//sh表示h的数量,sg表示g的数量
for (int i = 0, sh = 0, sg = 0; i < n; i ++)
{
//如果发现当前是G的话
if (str[i] == 'G')
{
//左边H的数量就是sh
l[i] = sh;
//因为这里是G
sg ++, sh = 0;
}
else
{
l[i] = sg;
sh ++;
sg = 0;
}
}
//枚举R的话就从后往前枚举
for (int i = n - 1, sh = 0, sg = 0; i >= 0; i --)
{
if (str[i] == 'G')
{
r[i] = sh;
sg ++;
sh = 0;
}
else
{
r[i] = sg;
sh ++;
sg = 0;
}
}
//定义一下答案
LL res = 0;
//枚举一下每一个牛作为一个孤独的牛,有多少个孤独区间以它为孤独的牛,res应该加上3中情况的总和
for (int i = 0; i < n; i ++)
{
//这里跟0去一个max,如果右边没有的话,不能少一个,不能越加越少
res += (LL)l[i]*r[i] + max(r[i]-1, 0) +
max(l[i]-1, 0);
}
printf("%lld\n", res);
return 0;
}