数据结构之并查集

并查集

  • 1. 并查集原理
  • 2. 并查集实现
  • 3. 并查集应用
    • 3.1 省份数量
    • 3.2 等式方程的可满足性
  • 4. 并查集的优缺点及时间复杂度

1. 并查集原理

并查表原理是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。并查集的思想是用一个数组表示了整片森林(parent),树的根节点唯一标识了一个集合,我们只要找到了某个元素的树根,就能确定它在哪个集合里。这类问题的抽象数据类型称为并查集(union-find set)。
这个数据结构主要用于解决一些元素分组的问题,比如在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。
并查集怎样使用?并查集是用一个数组来进行表示,其中数组下标用来表示一个个体的编号, 数组中存的元素表示的是该个体在哪一个组,用组中的某个元素表示该组有多少个体。
并查集通常用-1进行初始化,为什么不用0/1…呢?这是因为数组中的元素代表的是该个体在哪一个组,如果用0/1进行初始化,那么如果某个个体是自己一个为一组,但并查集中所表示的又是该个体是0/1组的。
接下来举一个并查集的例子
比如:某天有一个班级需要进行分组完成任务,已知该班有10位同学,将其分成3组,每组分别有5、 3、 2位同学。现在给这些学生进行编号:{0,1,2,3,4,5,6,7,8,9},其中{0,5,7,8,9},{1,4,6},{2,3}分别是每组同学的编号,0,1,2分别是每组的组长。接下来用一个并查集来表示该结构。
在这里插入图片描述
然后每收一个组员,就将该组员的元素加到组长下面,该组员存放的是组长的下边,如下图所示:0,1,2存放的绝对值就是每组成员的个数。
在这里插入图片描述
仔细观察数组中内的变化,可以得出以下结论:

  1. 数组的下标对应集合中元素的编号;
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数;
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标。
    每个小组去做相似的任务,但是发现1组长和2组长所带领的小队进度较慢,时间又有些不够,于是让这两个小组合并,2组长任然是一个组长,这是比昂查表发生如下变化:

在这里插入图片描述
通过以上例子可知,并查集一般可以解决如下问题:

  1. 查找元素属于哪个集合:沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
  2. 查看两个元素是否属于同一个集合:沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合:将两个集合中的元素合并,将一个集合名称改成另一个集合的名称
  4. 集合的个数:遍历数组,数组中元素为负数的个数即为集合的个数。

2. 并查集实现

接下来用代码来实现如上数据结构。

  1. 查找元素属于哪个集合
  2. 查看两个元素是否属于同一个集合
  3. 将两个集合归并成一个集合
  4. 集合的个数
#include <iostream>
#include <vector>
#include <assert.h>
using namespace std;

class UnionFindSet
{
public:
	UnionFindSet(int size)
		:_set(size, -1)
	{}

	size_t FindRoot(int x) //1.查找元素属于哪个集合
	{
		assert(x < _set.size());
		while (_set[x] >= 0) //可能有两个集合合并,如上述两个组合并的例子;所以需要循环,找到小于0的下标
			x = _set[x];

		return x;
	}
	
	bool IsSameRoot(int x1, int x2) //2.查看两个元素是否属于同一个集合
	{
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);

		if (root1 == root2)
			return true;
		else
			return false;
	}

	void Union(int x1, int x2) //3.将两个集合合并
	{
		int root1 = FindRoot(x1); //先找到两个集合各自的根
		int root2 = FindRoot(x2);

		if (root1 != root2) //如果根不相等,则将两个根进行合并
		{
			_set[root1] += _set[root2];
			_set[root2] = root1;
		}
	}

	size_t SetCount() //4.集合的个数
	{
		size_t count = 0;
		for (size_t i = 0; i < _set.size(); ++i)
		{
			if (_set[i] < 0)
				++count;
		}

		return count;
	}
private:
	vector<int> _set;
};

测试代码如下:

void test()
{
	UnionFindSet st(10);
	st.Union(0, 5);
	st.Union(0, 7);
	st.Union(0, 8);
	st.Union(0, 9);

	st.Union(1, 4);
	st.Union(1, 6);

	st.Union(2, 3);

	cout << "4在集合:" << st.FindRoot(4) << endl;
	cout << "5和7是否在同一个集合中(0/1):" << st.IsSameRoot(5, 7) << endl;
	cout << "5和6是否在同一个集合中(0/1):" << st.IsSameRoot(5, 6) << endl;
	cout << "合并前集合的个数:" << st.SetCount() << endl;
	cout << "合并集合1和集合2" << endl;
	st.Union(1, 2);
	cout << "合并后集合的个数:" << st.SetCount() << endl;

}

运行结果如下:
在这里插入图片描述

3. 并查集应用

3.1 省份数量

1.题目描述:有 n 个城市,其中一些彼此相连,另一些没有相连。如果城市 a 与城市 b 直接相连,且城市 b 与城市 c 直接相连,那么城市 a 与城市 c 间接相连。
省份 是一组直接或间接相连的城市,组内不含其他没有相连的城市。
给你一个 n x n 的矩阵 isConnected ,其中 isConnected[i][j] = 1 表示第 i 个城市和第 j 个城市直接相连,而 isConnected[i][j] = 0 表示二者不直接相连。
返回矩阵中 省份 的数量。
在这里插入图片描述
2.题目分析:可以用并查集来实现,对题目进行分析可以知道,要求集合的数量,所以需要上述3集合的合并函数和4集合的数量函数,其中3中又需要1函数,可以简单实现这几个函数,然后遍历题目中isConnected数组,只需要遍历一半即可。
3.代码如下:

class Solution {
public:
    size_t FindRoot(vector<int>& ufs, int x)
    {
        while (ufs[x] >= 0)
            x = ufs[x];
        return x;
    }
    void Union(vector<int>& ufs, int x1, int x2)
    {
        int root1 = FindRoot(ufs, x1);
        int root2 = FindRoot(ufs, x2);
        
        if (root1 != root2)
        {
            ufs[root1] += ufs[root2];
            ufs[root2] = root1;
        }
    }
    size_t UfsCount(vector<int>& ufs)
    {
        int count = 0;
        for (auto& x : ufs)
            if (x < 0)
                ++count;
        return count;
    }
    int findCircleNum(vector<vector<int>>& isConnected)
    {
        int n = isConnected.size();
        vector<int> ufs(n, -1);
        //合并相连的城市
        for (int i = 0; i < n; ++i)
        {
            for (int j = i + 1; j < n; ++j)
            {
                if (isConnected[i][j] == 1)
                    Union(ufs, i, j);
            }
        }
        //寻找不相连省份的数量
        size_t count = UfsCount(ufs);
        return count;
    }
};

3.2 等式方程的可满足性

1.题目描述:给定一个由表示变量之间关系的字符串方程组成的数组,每个字符串方程 equations[i] 的长度为 4,并采用两种不同的形式之一:“a==b” 或 “a!=b”。在这里,a 和 b 是小写字母(不一定不同),表示单字母变量名。
只有当可以将整数分配给变量名,以便满足所有给定的方程时才返回 true,否则返回 false。

提示:

  1. <= equations.length <= 500
  2. equations[i].length == 4
  3. equations[i][0] 和 equations[i][3] 是小写字母
  4. equations[i][1] 要么是 ‘=’,要么是 ‘!’
  5. equations[i][2] 是 ‘=’
    在这里插入图片描述
    2.题目分析:这道题需要合并相等的字母,所以需要函数3和1,由题知equations[i][0] 和 equations[i][3] 是小写字母,所以开辟一个大小为26的数组,把相等的字母合并为一组,再寻找不相等的,如果不相等得两个字母有相同的根,则返回false。

3.代码如下:

class Solution {
public:
    size_t FindRoot(vector<int>& ufs, int x)
    {
        while (ufs[x] >= 0)
            x = ufs[x];
        return x;
    }
    void Union(vector<int>& ufs, int x1, int x2)
    {
        int root1 = FindRoot(ufs, x1);
        int root2 = FindRoot(ufs, x2);
        
        if (root1 != root2)
        {
            ufs[root1] += ufs[root2];
            ufs[root2] = root1;
        }
    }
    bool equationsPossible(vector<string>& equations)
    {
        vector<int> ufs(26, -1);
        // 把相等的值加到一个集合中
        for (auto& str : equations)
        {
            if (str[1] == '=')
            {
                Union(ufs, str[0] - 'a', str[3] - 'a');
            }
        }
        // 在遍历一遍,找不相等的,不相等的根一定在一个集合
        for (auto& str : equations)
        {
            if (str[1] == '!')
            {
                int root1 = FindRoot(ufs, str[0] - 'a');
                int root2 = FindRoot(ufs, str[3] - 'a');
                if (root1 == root2)
                {
                    return false;
                }
            }
        }
        return true;
    }
};

4. 并查集的优缺点及时间复杂度

并查集这个数据结构的优缺点是

优点:

  1. 简单:并查集只需要一个一维数组来存储每个元素的父节点,操作也很简单,一般只需要两个基本函数:find和union。
  2. 高效:并查集的时间复杂度主要取决于树的高度,通过一些优化策略,如路径压缩和按秩合并,可以将树的高度控制在对数级别,从而实现近乎常数的查询和合并操作。
  3. 灵活:并查集可以用来解决各种涉及到元素分组、连通性、最小生成树等问题,可以根据具体问题进行扩展和修改。

缺点:

  1. 动态:并查集只能支持动态添加和合并元素,不能支持删除和分割元素,这限制了它的应用范围。
  2. 无序:并查集不能保证每个集合内部的元素是有序的,也不能提供遍历每个集合内部元素的方法,这使得它难以处理一些需要排序或遍历的问题。
  3. 单向:并查集只能判断两个元素是否属于同一个集合,不能判断两个元素之间的具体关系,如距离、方向、层次等,这使得它难以处理一些需要细节信息的问题。

时间复杂度
并查集的时间复杂度主要取决于树的高度,通过一些优化策略,如路径压缩和按秩合并,可以将树的高度控制在对数级别,从而实现近乎常数的查询和合并操作。具体来说:
初始化:O(n),其中n为元素个数。
查找:O(log n),其中n为元素个数。
合并:O(log n),其中n为元素个数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/82975.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

opencv进阶08-K 均值聚类cv2.kmeans()介绍及示例

K均值聚类是一种常用的无监督学习算法&#xff0c;用于将一组数据点分成不同的簇&#xff08;clusters&#xff09;&#xff0c;以便数据点在同一簇内更相似&#xff0c;而不同簇之间差异较大。K均值聚类的目标是通过最小化数据点与所属簇中心之间的距离来形成簇。 当我们要预测…

[国产MCU]-W801开发实例-GPIO输入与中断

GPIO输入与中断 文章目录 GPIO输入与中断1、硬件准备2、软件准备3、驱动实现4、驱动测试W801的GPIO支持软件配置中断,中断触发方式包含:上升沿触发、下降沿触发、高电平触发、低电平触发。本文在前面[ 国产MCU]-W801开发实例-按键与GPIO输入的基础上实现GPIO中断配置。 1、硬…

【Linux网络】网络编程套接字 -- 基于socket实现一个简单UDP网络程序

认识端口号网络字节序处理字节序函数 htonl、htons、ntohl、ntohs socketsocket编程接口sockaddr结构结尾实现UDP程序的socket接口使用解析socket处理 IP 地址的函数初始化sockaddr_inbindrecvfromsendto 实现一个简单的UDP网络程序封装服务器相关代码封装客户端相关代码实验结…

跟着NC学作图 | 使用python绘制折线图

写在前面 今天分享一篇使用Python绘制折线图的教程&#xff0c;在我们前提的教程中&#xff0c;关于使用R语言绘制折线图的教程也很少&#xff0c;跟着PC学作图 | 小提琴图Tufte箱形图折线图的绘制教程也只有相关一部分。 Python自己也是一直在学习&#xff0c;那么也就顺带分…

基于VUE3+Layui从头搭建通用后台管理系统(前端篇)九:自定义组件封装下

一、本章内容 续上一张,本章实现一些自定义组件的封装,包括文件上传组件封装、级联选择组件封装、富文本组件封装等。 1. 详细课程地址: 待发布 2. 源码下载地址: 待发布 二、界面预览 三、开发视频 基于VUE3+Layui从头搭建通用后台管

Azure VM上意外禁用NIC如何还原恢复

创建一个windows虚拟机&#xff0c;并远程连接管理员的方式打开powershell 首先查看虚拟网卡&#xff0c;netsh interface show interface 然后禁用虚拟网卡 ,netsh interface set interface Ethernet disable 去Azure虚拟机控制台&#xff0c;打开串行控制台 控制台中键入cmd,…

飞天使-jenkins进行远程linux机器修改某个文件的思路

文章目录 jenkins配置的方式jenkins中执行shell的思路 jenkins配置的方式 jenkins中执行shell的思路 下面的脚本别照抄&#xff0c;只是一个思路 ipall"$ips"# 将文本参数按行输出为变量 while IFS read -r line; doecho "$line" if [[ ! -z $line ]] &…

Redis数据结构之String

String 类型是 Redis 的最基本的数据类型&#xff0c;一个 key 对应一个 value&#xff0c;可以理解成与Memcached一模一样的类型。 String 类型是二进制安全的&#xff0c;意思是 Redis 的 String 可以包含任何数据&#xff0c;比如图片或者序列化的对象&#xff0c;一个 Redi…

使用 Apache Kafka 和 Go 将数据引入 OpenSearch

需要编写自定义集成层来满足数据管道中的特定要求&#xff1f;了解如何使用 Go 通过 Kafka 和 OpenSearch 实现此目的。 可扩展的数据摄取是OpenSearch等大规模分布式搜索和分析引擎的一个关键方面。构建实时数据摄取管道的方法之一是使用Apache Kafka。它是一个开源事件流平台…

常用消息中间件介绍

RocketMQ 阿里开源&#xff0c;阿里参照kafka设计的&#xff0c;Java实现 能够保证严格的消息顺序 提供针对消息的过滤功能 提供丰富的消息拉取模式 高效的订阅者水平扩展能力 实时的消息订阅机制 亿级消息堆积能力 RabbitMQ Erlang实现&#xff0c;非常重量级&#xff0c;更适…

ubuntu上使用osg3.2+osgearth2.9

一、介绍 在ubuntu上使用osgearth加载三维数字地球&#xff0c;首先要有osg和osgearth的库&#xff0c;这些可以直接使用apt-get下载安装&#xff0c;但是版本有些老&#xff0c;如果需要新版本的就需要自己编译。 #查看现有版本 sudo apt-cache madison openscenegraph #安装…

Vim在Mac电脑中的下载与安装方法:MacVim

本文介绍在Mac系统电脑中&#xff0c;下载、安装文本编辑器Vim软件&#xff08;MacVim软件&#xff09;的具体方法。 在Mac系统电脑中&#xff0c;原本就带有一个非图形界面的Vim&#xff1b;只要我们在终端中&#xff0c;输入如下的代码&#xff0c;就可以查看系统自带的非图形…

探索Perfetto:开源性能追踪工具的未来之光

探索Perfetto&#xff1a;开源性能追踪工具的未来之光 1. 引言 A. 介绍Perfetto的背景和作用 随着移动应用、桌面软件和嵌入式系统的不断发展&#xff0c;软件性能优化变得愈发重要。在这个背景下&#xff0c;Perfetto作为一款开源性能追踪工具&#xff0c;日益引起了开发者…

VR全景加盟项目如何开展?如何共赢VR时代红利?

VR全景作为一个新兴蓝海项目&#xff0c;相信有着很多人刚接触VR行业的时候都会有这样的疑问&#xff1a;VR全景加盟后项目如何开展&#xff1f;今天&#xff0c;我们就从项目运营的三个阶段为大家讲解。 一、了解项目时 目前VR全景已经被应用到各行各业中去&#xff0c;学校、…

JAVA设计模式总结之23种设计模式

一、什么是设计模式 设计模式&#xff08;Design pattern&#xff09;是一套被反复使用、多数人知晓的、经过分类编目的、代码设计…

【零基础自用】理解python为什么要用虚拟环境

不知道学过MATLAB或者R的小伙伴刚刚接触python的时候会不会被各种python版本&#xff0c;包版本&#xff0c;虚拟环境之类的搞的头晕眼花。 问题一 包版本 先来假设&#xff0c;我们自己开发了一个包MyPackage 1.0&#xff0c;里面包含一个模块叫PreTrained&#xff0c;然后去…

曲线救国 | 双非渣硕的秋招路

作者 | 带带大兄弟 面试锦囊之面经分享系列&#xff0c;持续更新中 欢迎后台回复"面试"加入讨论组交流噢 一篇旧文&#xff0c;可以参考~ 写在前面 双非渣硕&#xff0c;0实习&#xff0c;3篇水文&#xff0c;三个给老板当打工仔的nlp横向项目&#xff0c;八月份开…

基于YOLOv5n/s/m不同参数量级模型开发构建茶叶嫩芽检测识别模型,使用pruning剪枝技术来对模型进行轻量化处理,探索不同剪枝水平下模型性能影响

今天有点时间就想着之前遗留的一个问题正好拿过来做一下看看&#xff0c;主要的目的就是想要对训练好的目标检测模型进行剪枝处理&#xff0c;这里就以茶叶嫩芽检测数据场景为例了&#xff0c;在我前面的博文中已经有过相关的实践介绍了&#xff0c;感兴趣的话可以自行移步阅读…

小研究 - Android 字节码动态分析分布式框架(四)

安卓平台是个多进程同时运行的系统&#xff0c;它还缺少合适的动态分析接口。因此&#xff0c;在安卓平台上进行全面的动态分析具有高难度和挑战性。已有的研究大多是针对一些安全问题的分析方法或者框架&#xff0c;无法为实现更加灵活、通用的动态分析工具的开发提供支持。此…

Typora上传文件到Gitee

工作内容,不对外开放 一、Typora上传笔记到CSDN 一、安装node.js 官网链接:Node.js (nodejs.org) 下载后得到一个.msi文件,双击即可。 win + R 打开CMD,基于node -v 和npm -v,验证是否安装成功: 二、配置Gitee 1、新建仓库 2、开源此仓库 2.1、初始化readme文件