题目链接
冗余路径, Redundant Paths G
题目描述
为了从 F F F 个草场中的一个走到另一个,奶牛们有时不得不路过一些她们讨厌的可怕的树。
奶牛们已经厌倦了被迫走某一条路,所以她们想建一些新路,使每一对草场之间都会至少有两条相互分离的路径,这样她们就有多一些选择。
每对草场之间已经有至少一条路径。
给出所有 R R R 条双向路的描述,每条路连接了两个不同的草场,请计算最少的新建道路的数量,路径由若干道路首尾相连而成。
两条路径相互分离,是指两条路径没有一条重合的道路。
但是,两条分离的路径上可以有一些相同的草场。
对于同一对草场之间,可能已经有两条不同的道路,你也可以在它们之间再建一条道路,作为另一条不同的道路。
输入格式
第 1 1 1 行输入 F F F 和 R R R。
接下来 R R R 行,每行输入两个整数,表示两个草场,它们之间有一条道路。
输出格式
输出一个整数,表示最少的需要新建的道路数。
样例 #1
样例输入 #1
7 7
1 2
2 3
3 4
2 5
4 5
5 6
5 7
样例输出 #1
2
提示
【数据范围】
1
≤
F
≤
5000
1≤F≤5000
1≤F≤5000,
F
−
1
≤
R
≤
10000
F−1≤R≤10000
F−1≤R≤10000
【题目来源】
算法思想
根据题目描述,要在一个无向的连通图中,建一些新路,使每一对草场之间都会至少有两条相互分离的路径,计算最少的新建道路的数量。
先来分析一下测试样例,如下图所示。
其中蓝色虚线的边,
(
1
,
2
)
,
(
5
,
6
)
,
(
5
,
7
)
(1,2),(5,6),(5,7)
(1,2),(5,6),(5,7),删除其中一条后,都会将图分裂成两个不相连通的子图,这样的边又被成为割边,或桥。
而绿色虚线中的子图 { 2 , 3 , 4 , 5 } \{2,3,4,5\} {2,3,4,5}之间都有两条“相互分离的路径”(不存在相同边的路径)。在这个子图中是不存在桥的,这样的子图又被成为边双连通分量。
要解决这个问题之前,先来了解一下相关概念。
相关概念
割点
给定无向连通图
G
=
(
V
,
E
)
G=(V,E)
G=(V,E):
若对于
u
∈
V
u\in V
u∈V,从图中删去边节点
u
u
u以及所有与
u
u
u关联的边之后,
G
G
G分裂成两个或两个以上不相连的子图,则称
u
u
u为
G
G
G的割点。
桥
给定无向连通图
G
=
(
V
,
E
)
G=(V,E)
G=(V,E):
若对于
e
∈
E
e\in E
e∈E,从图中删去边
e
e
e之后,
G
G
G分裂成两个不相连的子图,则称
e
e
e为
G
G
G的桥或割边。
无向图的双连通分量
若一张无向连通图不存在割点,则成它为点双连通图。若一张无向连通图不存在桥,则称它为边双连通图。
无向图的极大点双连通子图被称为点双连通分量,记为 v-DCC \text{v-DCC} v-DCC,Vertex Double Connected Component;无向图的极大边双连通子图被称为边双连通分量,记为 e-DCC \text{e-DCC} e-DCC,Edge Double Connected Component。
Tarjan算法
Tarjan算法能够在线性时间内求出无向图的割点与桥,进一步可以求出无向图的双连通分量。
Tarjan算法基于无向图的深度优先遍历,并引入了时间戳的概念。
时间戳
在图的深度优先遍历过程中,按照每个节点第一次被访问的时间顺序,依次将 N N N个节点标记为 1 ∼ N 1\sim N 1∼N,该标记就被称为时间戳,记为 d f n [ u ] dfn[u] dfn[u]。
搜索树
在无向连通图中任选一个节点出发进行深度优先遍历,每个点只访问一次。所有发生递归的边
(
u
,
v
)
(u,v)
(u,v),构成一棵树,被称为无向连通图的搜索树。如下图所示,其中节点和绿色的边构成了一棵搜索树。
追溯值
除了时间戳之外,Tarjan算法还引入了一个追溯值 l o w [ u ] low[u] low[u]。设子树 s u b t r e e ( u ) subtree(u) subtree(u)表示搜索树中以 u u u为根的子树。 l o w [ u ] low[u] low[u]表示为以下节点的时间戳的最小值:
- s u b t r e e ( u ) subtree(u) subtree(u)中的节点
- 通过 1 1 1条不在搜索树上的边,能够到达 s u b t r e e ( u ) subtree(u) subtree(u)的节点
如上图所示,其中节点编号为时间戳。
s
u
b
t
r
e
e
(
2
)
=
{
2
,
3
,
4
,
5
}
subtree(2)=\{2,3,4,5\}
subtree(2)={2,3,4,5},由于节点
1
1
1通过不在搜索树上的边
1
→
5
1\to5
1→5能够到达
s
u
b
t
r
e
e
(
2
)
subtree(2)
subtree(2),所以
l
o
w
[
2
]
=
1
low[2]=1
low[2]=1
为了计算
l
o
w
[
u
]
low[u]
low[u],首先将low[u] = dfn[u] = ++timestamp
,然后考虑从
u
u
u出发的每条边
(
u
,
v
)
(u,v)
(u,v):
- 若在搜索树上,
u
u
u是
v
v
v的父结点,则令
low[u] = min(low[u], low[v])
- 若无向边
(
u
,
v
)
(u,v)
(u,v)不是搜索树上的边,则令
low[u] = min(low[u], dfn[v])
下图括号里的数值标注了每个节点的追溯值
l
o
w
low
low:
割边(桥)判断法
无向边 ( u , v ) (u,v) (u,v)是桥,当且仅当搜索树上存在 u u u的一个子节点 v v v满足: d f n [ u ] < l o w [ v ] dfn[u]<low[v] dfn[u]<low[v]
根据定义, d f n [ u ] < l o w [ v ] dfn[u]<low[v] dfn[u]<low[v]说明从 s u b t r e e ( v ) subtree(v) subtree(v)出发,在不经过 ( u , v ) (u,v) (u,v)这条边的前提下,不管走那条边都无法到达 u u u或者比 u u u更早访问的节点。这样的话,若把 ( u , v ) (u,v) (u,v)删除,则 s u b t r e e ( v ) subtree(v) subtree(v)就形成了一个封闭的连通块,与节点 u u u没有边相连,图断开成立两部分。因此 ( u , v ) (u,v) (u,v)是割边(桥)。
下图中的两条割边用虚线标识:
不难发现,桥一定是搜索树种的边,一个简单环中的边一定都不是桥。
需要注意的是,在求一张无向图中所有的割边时,因为深度优先遍历的是无向图,所以从每个节点 u u u出发,总能访问到它的父结点 f a fa fa。根据追溯值 l o w low low的计算方法, ( u , f a ) (u,fa) (u,fa)属于搜索树上的边,且 f a fa fa不是 u u u的子节点,所以不能用 f a fa fa的时间戳来更新 l o w [ u ] low[u] low[u]。
但是如果只记录每个节点的父节点,会无法处理重边的情况——当 u u u与 f a fa fa之间有多条边时, ( u , f a ) (u,fa) (u,fa)一定不是桥。在这些重边中,只有一条算是搜索树上的边,其它重边都不算。故有重边时, d f n [ f a ] dfn[fa] dfn[fa]能用来更新 l o w [ u ] low[u] low[u]。
一个好的解决方案是:将记录 f a fa fa改为记录递归进入每个节点的边的编号 f r o m from from。若沿着编号为 f r o m from from的边递归进入了节点 u u u,则忽略从 u u u出发相对于 f r o m from from的反向边。
算法实现
- 基于上述分析,可以通过Tarjan求出图中所有的桥边,同时也能求出图中的边双连通分量。
- 如果将每个边双连通分量缩成一个点,原图就变成一棵树,桥就是树的边。
- 然后只需将在树中所有叶子节点间添加边,将树变成一个边双连通分量,就能保证整个图中任意两点之间都至少有两条“相互分离的路径”。如下图所示:
由于叶子节点的度都为 1 1 1,因此只需要统计处度为 1 1 1的节点个数 c n t cnt cnt,最终答案为 ⌈ c n t 2 ⌉ \lceil \frac {cnt}{2}\rceil ⌈2cnt⌉。
代码实现
#include <bits/stdc++.h>
using namespace std;
const int N = 5005, M = 40005;
int h[N], e[M], ne[M], idx;
int n, m;
int dfn[N], low[N], timestamp, stk[N], top, dcc_cnt, id[N], d[M];
bool bridge[M]; //标记是否为桥(割边)
void add(int a, int b) // 添加一条边a->b
{
e[idx] = b, ne[idx] = h[a], h[a] = idx ++ ;
}
//from表示进入节点u的边
void tarjan(int u, int from)
{
dfn[u] = low[u] = ++ timestamp;
stk[++ top] = u;
for(int i = h[u]; ~ i; i = ne[i])
{
int v = e[i];
if(!dfn[v]) //v点没有访问,则边i是搜索树上的边
{
tarjan(v, i);
low[u] = min(low[u], low[v]);
if(dfn[u] < low[v]) //v无法回到u,说明当前边是桥
bridge[i] = bridge[i ^ 1] = true; //将正向边、反向边标记为桥
}
else //边i不是搜索树上的边
{
if(i != (from ^ 1)) //边i不是from的反向边
low[u] = min(low[u], dfn[v]);
}
}
if(dfn[u] == low[u]) //u是双连通分量的最高点
{
//取出该双连通分量中的所有点进行标记
++ dcc_cnt;
int v;
do {
v = stk[top --];
id[v] = dcc_cnt;
} while(u != v);
}
}
int main()
{
cin >> n >> m;
memset(h, -1, sizeof h);
while(m --)
{
int a, b;
cin >> a >> b;
add(a, b), add(b, a);
}
tarjan(1, -1); //每对草场之间已经有至少一条路径,是连通的,因此从顶点1出发即可
//遍历每条边
for(int i = 0; i < idx; i ++)
{
if(bridge[i]) //如果是桥
d[id[e[i]]] ++; //给桥的两个顶点所在的双连通分量的度数增加1
}
int cnt = 0; //统计叶子节点的个数,即度为1的节点个数
for(int i = 1; i <= dcc_cnt; i ++)
{
if(d[i] == 1) cnt ++;
}
cout << (cnt + 1) / 2 << endl;
}