# 并查集(Union-find sets)

## 原理

+ **并查集**是一种树形的数据结构，由一系列不相交的集合组成，用于处理一些不相交集合的**合并**和**查询**问题，具有良好的时间的空间复杂度。

![基本原理](https://oi-wiki.org/ds/images/dsu1.png)
![路径压缩](https://oi-wiki.org/ds/images/dsu2.png)

## 实现

### 初始化并查集

+ 通常使用数组来实现：初始化一个一维的数组$Fa[]$，数组的下标代表元素的索引，数组中保存了当前元素所在集合的代表的索引，初始化为元素自身。

### 查找操作(Find)

+ 用来查找某个元素所属集合中的根节点的索引，可以用来判断两个元素是否属于同一个集合。为了保证查找的效率，在Find操作中需要压缩路径，即实时的更新$Fa[]$中的值。

### 合并操作(Union)

![合并操作示意图](https://s1.ax1x.com/2020/04/16/JF14Ve.png)

+ 合并操作是将两个集合合并为一个集合，只需要找到两个集合的代表节点$X$, $Y$，然后令$Fa[X]=Y$(1)或$Fa[Y]=X$(2)即可。选择操作(1)和(2)可以根据集合的大小或深度来确定，原则上要保证合并后的树的深度更小。

## 用途

+ 最小生成树算法 中的 Kruskal 是基于并查集的算法。
+ 求连通子图。
+ 求最近公共祖先（Least Common Ancestors, LCA）。

## 参考资料

+ https://www.cnblogs.com/cyjb/p/UnionFindSets.html
+ https://oi-wiki.org/ds/dsu/
+ https://zhuanlan.zhihu.com/p/93647900


In [1]:
# 并查集的基本实现，未考虑合并操作时树的平衡。
class UnionFindSets():
    
    # m代表元素个数，默认元素的编号从0开始，且依次递增。
    def __init__(self, m):
        self.father = [i for i in range(m)]
    
    # x为待查询元素索引，返回x所在集合中的代表元素。
    def find(self, x):
        if self.father[x] != x:
            self.father[x] = self.find(self.father[x])
        return self.father[x]
    
    # 合并两个元素(x,y)所在的集合。
    def union(self, x, y):
        fx = self.find(x)
        fy = self.find(y)
        if fx != fy:
            self.father[fx] = fy

# 简单的测试算例

![简单测试算例](https://pic1.zhimg.com/80/v2-3c353bc781c7f3553079d541a9cfdc28_720w.jpg)

+ 共六个元素，合并(1,3);(2,3);(4,5);(5,6)

+ 输出各个元素是否在相同集合中。

In [2]:
# 测试并查集的效果。
m = 6
pair = ((0,2),(1,2),(3,4),(4,5))

ufs = UnionFindSets(6)
for (x,y) in pair:
    ufs.union(x,y)
sets = dict()
for i in range(m):
    fa = ufs.find(i)
    if fa in sets:
        sets[fa].append(i)
    else:
        sets[fa] = [i]
for li in sets.values():
    for num in li:
        print(num, end=' ')
    print()

0 1 2 
3 4 5 
