数据结构 —— 最小生成树
- 什么是最小生成树
- Kruskal算法
- Prim算法
今天我们来看一下最小生成树:
我们之前学习的遍历算法并没有考虑权值,仅仅就是遍历结点:
今天的最小生成树要满足几个条件:
- 考虑权值
- 所有结点联通
- 权值之和最小
- 无环
什么是最小生成树
最小生成树(Minimum Spanning Tree,简称MST)是指在一个加权的、无向的连通图中,由所有顶点构成的一个子图,这个子图是一棵树,并且其所有边的权重之和最小。换句话说,最小生成树是在保证图中所有顶点连通的前提下,使得连接这些顶点的边的总成本最低的一棵树。
最小生成树具有以下特性:
- 它包含图中的所有顶点。
- 它是一个没有环的连通子图(即树)。
- 它的边数比顶点数少一(对于 n 个顶点的图,有 n-1 条边)。
- 它的边的总权重是所有可能生成树中最小的。
最小生成树在很多实际应用中都有重要作用,例如在设计电信网络时,为了连接多个地点而需要铺设电缆或光纤,最小生成树可以用来确定一种成本最低的铺设方案。
求解最小生成树的常用算法包括:
- Kruskal算法:此算法通过不断选择权重最小的边来构建最小生成树,同时避免添加会导致环路形成的边。它通常利用并查集(Disjoint Set Union)数据结构来检测环路。
- Prim算法:此算法从任意一个顶点开始,逐步将顶点及其权重最小的连接边加入到生成树中,直到所有顶点都被包含进来。Prim算法可以使用优先队列(Priority Queue)来高效地选择下一个应加入的边。
我们今天就来介绍一下这两种算法:
Kruskal算法
Kruskal算法,简单来说,就是把所有边拿出来,从小到大挑边,构成最小生成树:
Kruskal算法是一种用于寻找加权、无向连通图的最小生成树(Minimum Spanning Tree, MST)的贪心算法。它的核心思想是在不形成任何环路的情况下,选择权重最小的边来构建生成树,直到所有的顶点都被包含在树中。
以下是Kruskal算法的主要步骤:
- 排序边:将图中所有的边按照权重从小到大排序。
- 初始化森林:创建一个森林,其中每个顶点都是一个单独的树(即每个顶点都是一个独立的连通分量)。
- 选择边:遍历排序后的边列表。对于每条边,检查它的两个端点是否已经在同一棵树中(即是否属于同一个连通分量)。如果不是,将这条边添加到最小生成树中,并将这两个顶点所在的树合并成一棵更大的树。
- 重复步骤3:继续选择满足条件的边,直到最小生成树中包含了图中的所有顶点,或者已经选择了
n-1
条边(其中n
是顶点的数量)。
Kruskal算法的关键在于能够快速地检测边的两个端点是否属于同一棵树,这通常是通过使用并查集(Union-Find)数据结构来实现的。并查集允许我们在对数时间内执行“查找”操作(确定顶点所属的树)和“合并”操作(将两棵树合并成一棵树)。
// 使用Kruskal算法计算最小生成树的总权重
W Kruskal(Self& minTree) // Self应为当前类的引用,minTree是用于存储最小生成树的实例
{
// 初始化最小生成树的顶点集和索引
minTree._vertex = _vertex;
minTree._index = _index;
minTree._matrix.resize(_vertex.size()); // 创建一个邻接矩阵,用于存储最小生成树中的边的权重
for (auto& e : minTree._matrix) // 将邻接矩阵的所有元素初始化为最大权重值MAX_W
{
e.resize(_vertex.size(), MAX_W);
}
// 创建一个优先级队列,用于存储边的信息
priority_queue<Edge, vector<Edge>, greater<Edge>> pq;
// 将所有边(除了自环和重复边)加入优先级队列
for (size_t i = 0; i < _vertex.size(); i++)
{
for (size_t j = 0; j < _vertex.size(); j++)
{
if (i < j && _matrix[i][j] != MAX_W) // 确保不加入自环和重复边
{
pq.push(Edge(i, j, _matrix[i][j])); // 将边加入优先级队列
}
}
}
// 初始化变量,用于记录最小生成树的总权重和边的数量
W total = W();
int size = 0;
UnionFindSet ufs(_vertex.size()); // 创建并查集,用于判断顶点是否已经连接
while (!pq.empty()) // 当优先级队列非空时
{
Edge min = pq.top(); // 取出权重最小的边
pq.pop(); // 移除已取出的边
// 判断边的两个顶点是否已经在同一集合内(即是否已经连接)
if (!ufs.InSet(min._srci, min._desi))
{
cout << _vertex[min._srci] << "-" << _vertex[min._desi] << ":" << _matrix[min._srci][min._desi] << endl; // 打印边的信息
minTree._AddEdge(min._srci, min._desi, min._w); // 将边加入最小生成树
total += min._w; // 更新最小生成树的总权重
ufs.Union(min._srci, min._desi); // 合并两个顶点所在的集合
++size; // 增加边的数量
}
}
cout << endl;
minTree.Print(); // 打印最小生成树
// 如果边的数量等于顶点数量减一,则返回最小生成树的总权重
if (size == _vertex.size() - 1)
{
return total;
}
else
{
return W(); // 否则返回默认权重值(可能表示无法形成最小生成树)
}
}
我们可以来测试一下:
void TestGraph2()
{
string a[] = {"海皇","高斯","小傲","小潮","胖迪","小杨","皖皖"};
Graph<string, int,INT_MAX, false> g1(a, sizeof(a)/sizeof(a[0]));
g1.AddEdge("小潮", "小傲", 30);
g1.AddEdge("小潮", "高斯", 83);
g1.AddEdge("小潮", "海皇", 34);
g1.AddEdge("胖迪", "海皇", 78);
g1.AddEdge("胖迪", "小傲", 76);
g1.AddEdge("小杨", "皖皖", 54);
g1.AddEdge("小杨", "高斯", 48);
g1.Print();
cout << endl;
Graph<string, int, INT_MAX, false> kminTree;
cout << "Kruskal:" << g1.Kruskal(kminTree) << endl;
}
按照Kruskal算法,构建出来的图是这样的:
胖迪和海皇的关系被抹除了,其实我们之前的图里有环:
Kruskal算法的时间复杂度主要取决于排序边的操作和并查集的效率。在最好的情况下,排序边的时间复杂度为O(E log E),其中E是边的数量;并查集操作的时间复杂度接近常数,因此整个算法的时间复杂度近似为O(E log E)。由于排序的主导作用,该算法适用于边的数量远小于顶点数量平方的图,即稀疏图。
Prim算法
Prim算法和上面的思想差不多,但是,Prim算法会从一个顶点开始,这里我假设是从"小潮"开始:
跟小潮连接的3条边,会进入优先级队列,维护起来:
接下来,会选择30的权重来构造,然后30这条边的另一边的小傲的边入优先级队列:
以此类推:
// 使用Prim算法构建并返回最小生成树的总权重
W Prim(Self& minTree, const V& vertex) // Self应该是当前类的引用,minTree是用于存储最小生成树的实例,vertex是顶点的容器
{
// 初始化最小生成树的顶点集和索引
minTree._vertex = _vertex;
minTree._index = _index;
minTree._matrix.resize(_vertex.size()); // 创建一个邻接矩阵,用于存储最小生成树中的边的权重
// 初始化邻接矩阵的所有元素为最大权重值MAX_W
for (auto& e : minTree._matrix)
{
e.resize(_vertex.size(), MAX_W);
}
// 区分顶点集合:已选择和未选择
size_t srcIndex = FindSrci(vertex); // 找到起始顶点的索引
vector<bool> select(_vertex.size(), false); // 已选择顶点集合,初始时所有顶点都未选择
vector<bool> non_select(_vertex.size(), true); // 未选择顶点集合,初始时所有顶点都未被选择
select[srcIndex] = true; // 起始顶点被标记为已选择
non_select[srcIndex] = false; // 起始顶点从未选择集合中移除
// 创建一个优先级队列,用于存储待处理的边
priority_queue<Edge, vector<Edge>, greater<Edge>> pq; // 边按权重从小到大排序
// 将起始顶点的邻接边加入优先级队列
for (int i = 0; i < _vertex.size(); i++)
{
if (_matrix[srcIndex][i] != MAX_W) // 如果存在边,且不是最大权重(表示边存在)
{
pq.push(Edge(srcIndex, i, _matrix[srcIndex][i])); // 加入边信息到优先级队列
}
}
// 初始化计数器和总权重
size_t size = 0;
W total = W(); // 初始化总权重为0
// 当优先级队列非空时
while (!pq.empty())
{
Edge min = pq.top(); // 获取当前权重最小的边
pq.pop(); // 从队列中移除已处理的边
// 如果目标顶点已被选择,跳过这条边
if (select[min._desi]) continue;
// 输出边的信息
cout << _vertex[min._srci] << "-" << _vertex[min._desi] << ":" << _matrix[min._srci][min._desi] << endl;
// 添加边到最小生成树
minTree._AddEdge(min._srci, min._desi, min._w);
// 标记目标顶点为已选择
select[min._desi] = true;
non_select[min._desi] = false;
++size; // 已处理的边数量加1
total += min._w; // 更新总权重
// 将新加入顶点的邻接边加入优先级队列
for (size_t i = 0; i < _vertex.size(); i++)
{
if (_matrix[min._desi][i] != MAX_W && non_select[i]) // 如果存在边且目标顶点未被选择
{
pq.push(Edge(min._desi, i, _matrix[min._desi][i])); // 加入边信息到优先级队列
}
}
}
// 打印最小生成树
minTree.Print();
// 如果边的数量等于顶点数量减一,则返回最小生成树的总权重
if (size == _vertex.size() - 1)
{
return total;
}
else
{
return W(); // 否则返回默认权重值(可能表示无法形成最小生成树)
}
}
void TestGraph2()
{
string a[] = {"海皇","高斯","小傲","小潮","胖迪","小杨","皖皖"};
Graph<string, int,INT_MAX, false> g1(a, sizeof(a)/sizeof(a[0]));
g1.AddEdge("小潮", "小傲", 30);
g1.AddEdge("小潮", "高斯", 83);
g1.AddEdge("小潮", "海皇", 34);
g1.AddEdge("胖迪", "海皇", 78);
g1.AddEdge("胖迪", "小傲", 76);
g1.AddEdge("小杨", "皖皖", 54);
g1.AddEdge("小杨", "高斯", 48);
g1.Print();
cout << endl;
Graph<string, int, INT_MAX, false> kminTree;
cout << "Kruskal:" << g1.Kruskal(kminTree) << endl;
cout << endl;
Graph<string, int, INT_MAX, false> pminTree;
cout << "Prim:" << g1.Prim(pminTree,"小潮") << endl;
}
Prim算法同样是用于寻找加权无向图的最小生成树(Minimum Spanning Tree, MST)的一种贪心算法。与Kruskal算法不同的是,Prim算法从一个顶点开始,逐步添加最短的边来扩展树,直到包含所有的顶点。
Prim算法基本步骤:
- 选择任意一个顶点作为起始顶点。
- 在当前树的顶点的邻接边中找到权重最小的边,将这条边添加到树中,并将新的顶点也添加进来。
- 重复步骤2,直到树包含所有的顶点。
这是两种算法挑选边的过程和最后结果,大家可以类比对比:
//Kruskal算法
W Kruskal(Self& minTree)
{
//初始化
minTree._vertex = _vertex;
minTree._index = _index;
minTree._matrix.resize(_vertex.size());
for (auto& e : minTree._matrix)
{
e.resize(_vertex.size(), MAX_W);
}
//优先级队列
priority_queue<Edge, vector<Edge>, greater<Edge>> pq;
for (size_t i = 0; i < _vertex.size(); i++)
{
for (size_t j = 0; j < _vertex.size(); j++)
{
if (i < j && _matrix[i][j] != MAX_W)
{
pq.push(Edge(i, j, _matrix[i][j]));
}
}
}
//拿边构造最小生成树
W totoal = W();
int size = 0;
UnionFindSet ufs(_vertex.size());
while (!pq.empty())
{
Edge min = pq.top();
//出边
pq.pop();
//判断是否在同一集合
if (!ufs.InSet(min._srci ,min._desi))
{
cout << _vertex[min._srci] << "-" << _vertex[min._desi] <<
":" << _matrix[min._srci][min._desi] << endl;
minTree._AddEdge(min._srci, min._desi, min._w);
totoal += min._w;
//合并
ufs.Union(min._srci, min._desi);
++size;
}
}
cout << endl;
minTree.Print();
if (size == _vertex.size() - 1)
{
return totoal;
}
else
{
return W();
}
}
W Prim(Self& minTree,const V& vertex)
{
//初始化
minTree._vertex = _vertex;
minTree._index = _index;
minTree._matrix.resize(_vertex.size());
for (auto& e : minTree._matrix)
{
e.resize(_vertex.size(), MAX_W);
}
//区分集合
size_t srcIndex = FindSrci(vertex);
vector<bool> select(_vertex.size(), false);
vector<bool> non_select(_vertex.size(), true);
select[srcIndex] = true;
non_select[srcIndex] = false;
//开始入边
priority_queue<Edge, vector<Edge>, greater<Edge>> pq;
for (int i = 0; i < _vertex.size(); i++)
{
if (_matrix[srcIndex][i] != MAX_W)
{
pq.push(Edge(srcIndex, i, _matrix[srcIndex][i]));
}
}
size_t size = 0;
W totoal = W();
while (!pq.empty())
{
Edge min = pq.top();
pq.pop();
if (select[min._desi])
continue;
cout << _vertex[min._srci] << "-" << _vertex[min._desi] <<
":" << _matrix[min._srci][min._desi] << endl;
minTree._AddEdge(min._srci, min._desi, min._w);
select[min._desi] = true;
non_select[min._desi] = false;
++size;
totoal += min._w;
//新入的顶点的边也加入到优先级队列
for (size_t i = 0; i < _vertex.size(); i++)
{
if (_matrix[min._desi][i] != MAX_W && non_select[i])
{
pq.push(Edge(min._desi, i, _matrix[min._desi][i]));
}
}
}
minTree.Print();
if (size == _vertex.size() - 1)
{
return totoal;
}
else
{
return W();
}
}