一、并查集原理
在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集 合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集 合的运算。适合于描述这类问题的抽象数据类型称为并查集。
比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校, 起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; 给以下 数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是: 西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5}就相互认识了,10个
人形成了三个小团体。假设右三个群主0,1,2担任队长,负责大家的出行。

一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。
从上图可以看出:编号
6,7,8
同学属于
0
号小分队,该小分队中有
4
人
(
包含队长
0)
;编号为
4
和
9
的同学属于
1
号小分队,该小分队有3
人
(
包含队长
1)
,编号为
3
和
5
的同学属于
2
号小分队,该小分队有
3
个人
(
包含队长
1)
。
仔细观察数组中内融化,可以得出以下结论:
1.
数组的下标对应集合中元素的编号
2.
数组中如果为负数,负号代表根,数字代表该集合中元素个数
3.
数组中如果为非负数,代表该元素双亲在数组中的下标
在公司工作一段时间后,西安小分队中
8
号同学与成都小分队
1
号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:

现在0集合有7个人,2集合有3个人,总共两个朋友圈。
通过以上例子可知,并查集一般可以解决一下问题:
1. 查找元素属于哪个集合
沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
2. 查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
3. 将两个集合归并成一个集合
将两个集合中的元素合并
将一个集合名称改成另一个集合的名称
4. 集合的个数
遍历数组,数组中元素为负数的个数即为集合的个数。
二、并查集模拟实现
import java.util.Arrays;
public class UnionFindSet {
public int[] elem;
public int usedSize;
public UnionFindSet(int n) {
elem=new int[n];
Arrays.fill(elem,-1);
}
/**
* 找到集合的根节点
* @param x
* @return
*/
public int FindRoot(int x) {
while (elem[x] >= 0) {
x=elem[x];
}
return x;
}
/**
* 检查这两个数据是否在同一个集合
* @param x1
* @param x2
* @return
*/
public boolean isSameUnionFindSet(int x1,int x2) {
int index1=FindRoot(x1),index2=FindRoot(x2);
if(index1==index2) return true;
return false;
}
/**
* 合并两个集合
* @param x1
* @param x2
*/
public void union(int x1,int x2) {
int index1=FindRoot(x1),index2=FindRoot(x2);
if(index1==index2) return;
elem[index1]=elem[index1]+elem[index2];
elem[index2]=index1;
}
/**
* 获取集合数量
*/
public int getCount() {
int count=0;
for (int x : elem) {
if(x<0) {
count++;
}
}
return count;
}
}
三、应用
leetcode题目:
有 n
个城市,其中一些彼此相连,另一些没有相连。如果城市 a
与城市 b
直接相连,且城市 b
与城市 c
直接相连,那么城市 a
与城市 c
间接相连。
省份 是一组直接或间接相连的城市,组内不含其他没有相连的城市。
给你一个 n x n
的矩阵 isConnected
,其中 isConnected[i][j] = 1
表示第 i
个城市和第 j
个城市直接相连,而 isConnected[i][j] = 0
表示二者不直接相连。
返回矩阵中 省份 的数量。
示例 1:
输入:isConnected = [[1,1,0],[1,1,0],[0,0,1]] 输出:2
示例 2:
输入:isConnected = [[1,0,0],[0,1,0],[0,0,1]] 输出:3
我们可以使用上述实现的并查集来解决这道题:
class Solution {
public int findCircleNum(int[][] isConnected) {
int n=isConnected.length,m=isConnected[0].length;
UnionFindSet ufs=new UnionFindSet(n);
for(int i=0;i<n;i++) {
for(int j=0;j<m;j++) {
if(isConnected[i][j]==1) {
ufs.union(i,j);
}
}
}
return ufs.getCount();
}
}