# 并查集 Union Find

## 基于树的实现，每个元素是一个节点，并指明其父元素

In [1]:
class UnionFind2:
    def __init__(self, n):
        """
        构造并查集 
        """
        self.__count=n
        # 初始化的时候，每个元素的父元素，指向自己
        # 这样，初始的时候，两两元素互不连接
        self.__parent=[i for i in range(n)]
        
        # 第一步优化：
        # 优化find递归树的深度
        # 新增加的属性
        # 记录以元素i为根节点的集合中，元素的个数
        # 初始化都是1，只包含自身
        self.__size=[1 for in in range(n)]
        
        # 第二步优化：
        # 单纯依靠根节点包含的元素数量，不足以 尽可能地降低树的深度
        # 这里，还要考虑根节点本身的层数，也就是rank
        # 记录以元素 i 为根节点的集合中，树的高度
        # 初始化都是1 
        self.__rank=[1 for i in range(n)]
    
    def find(self, p):
        """
        查看元素，返回元素的根元素
        """
        assert p>=0 and p<self.__count
        
        # 这里用到递归
        # 就涉及到递归树的深度
        # 因此，要尽量使得递归树深度小
        while p!=self.__parent[p]:
            p=self.__parent[p]
        return p
    
    def isConnected(self, p, q):
        """
        检查两个元素是否属于同一个根
        """
        return self.find(p)==self.find(q)
    
    def unionElements(self, p, q):
        """
        将两个元素合并，也就是使得其根节点一样
        """
        pRoot=self.find(p)
        qRoot=self.find(q)
        
        if pRoot==qRoot:
            return
        # 这里值得优化
        # 因为这里，直接影响了find中的递归树深度
        # 因此，不能直接采取如下方式
        # 要使得元素少的树，指向元素多的根节点
        # 这样，可以不至于树的深度过大
        
        # 优化之前
        # self.__parent[pRoot] = qRoot
        
        # 第一步优化：考虑两个根节点包含的元素个数
        # 优化之后
        if self.__size[pRoot]<self.__size[qRoot]:
            self.__parent[pRoot]=qRoot
            self.__size[qRoot] += self.__size[pRoot]
        else:
            self.__parent[qRoot]=pRoot
            self.__size[pRoot] += self.__size[qRoot]
            
        # 第二步优化：考虑两个根节点的树深度（层级）
        # 优化之后
        if self.__rank[pRoot]<self.__rank[qRoot]:
            self.__parent[pRoot]=qRoot
        elif self.__rank[pRoot]>self.__rank[qRoot]:
            self.__parent[qRoot]=pRoot
        else:
            # 相等
            self.__parent[qRoot]=qRoot
            # 注意，层级有变化
            self.__rank[pRoot]+=1

In [2]:
def test_uf(n):
    uf=UnionFind2(n)
    import numpy as np
    
    %%time
    for i in range(n):
        arr=np.random.randint(0,n,2)
        uf.unionElements(arr[0], arr[1])
    
    for i in range(n):
        arr=np.random.randint(0, n, 2)
        uf.isConnected(arr[0], arr[1])

In [5]:
test_uf(100000)

Wall time: 0 ns
