In [2]:
class UnionFind:
    def __init__(self, all_data: list):
        """
        初始化并查集
        :param all_data: 数据列表
        """
        self.parent = {}
        self.size = {}

        for data in all_data:
            self.parent[data] = data # 初始父亲结点为自己
            self.size[data] = 1

    def find(self, data):
        node = data # 防止引用类型的 data 被改变
        nodes = [] # 将路上的 node 全部记下来
        while self.parent[node] != node:
            nodes.append(node)
            node = self.parent[node]
        for n in nodes: # 将路上的 node 的父结点全部指向根结点以满足「折叠规则」
            self.parent[n] = node
            self.size[n] = 1
        return node

    def union(self, data1, data2):
        root1 = self.find(data1)
        root2 = self.find(data2)
        if root1 == root2:
            return
        # size 小的集合合并到 size 大的集合
        if self.size[root1] >= self.size[root2]:
            self.parent[root2] = root1
            self.size[root1] += self.size[root2]
        else:
            self.parent[root1] = root2
            self.size[root2] += self.size[root1]

In [3]:
union_find = UnionFind([1, 2, 3, 4, 5, 6, 7, 8])

In [4]:
union_find.find(7)

7

In [5]:
union_find.union(1, 2)

In [6]:
union_find.union(2, 4)

In [7]:
union_find.find(9)

KeyError: 9