# 数据结构优缺点

#特点：是一种属性的数据结构，用于处理一些不交集(Disjoint Sets)的合并及查询问题。

# 和其他数据结构的关系

#

# 常用于解决什么样的问题

#1、通过小弟找老大；
#2、帮派识别；
#3、两种优化方式：优化1：按rank优化；优化2：路径压缩；
#4、一般要找连续子数组问题时可以考虑用并查集 + 逆向思维(往空的里面逐步加，不要想从满的里面逐步减)来解决；

# 常用的实现方式

In [4]:
# 并查集 - 一维（如：547省份）
class UnionFind:
    def __init__(self, isConnected):
        n = len(isConnected)
        self.root = list(range(n))
        self.rank = [1] * n 
        self.count = n
    
    def find(self, i):
        if self.root[i] != i:
            self.root[i] = self.find(self.root[i])
        return self.root[i]

    def union(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)
        if x_root == y_root:
            return 
        if self.rank[x_root] < self.rank[y_root]:
            x_root, y_root = y_root, x_root
        self.root[y_root] = x_root
        if self.rank[x_root] == self.rank[y_root]:
            self.rank[x_root] += 1
        self.count -= 1
    
    def get_count(self):
        return self.count

In [5]:
# 并查集 - 二维转一维（如：200岛屿数量）
class UnionFind:
    def __init__(self,grid):
        m, n = len(grid), len(grid[0])
        self.root = [0] * (m * n) # 索引位置记录root
        self.rank = [0] * (m * n) # 记录rank，用于合并优化
        self.count = 0 # 用来记录‘1’ 所有不同root的数量  
        for i in range(m):
            for j in range(n):
                if grid[i][j] == '0':
                    continue
                idx = i * n + j 
                self.root[idx] = idx
                self.rank[idx] = 1
                self.count += 1
    
    def find_root(self, i):
        if self.root[i] != i:
            self.root[i] = self.find_root(self.root[i])
        return self.root[i]
    
    def union(self, x, y):
        x_root = self.find_root(x)
        y_root = self.find_root(y)
        if x_root == y_root:
            return 

        if self.rank[x_root] < self.rank[y_root]:
            x_root, y_root = y_root, x_root
        self.root[y_root] = x_root # 上面的判断保证了y_root的rank <= x_root 的rank
        if self.rank[x_root] == self.rank[y_root]:
            self.rank[x_root] += 1
        self.count -= 1

    def get_count(self):
        return self.count

# 总结

## 第一步定义并查集类；
## 第二步初始化self.root 和 self.rank，有需要的话也初始化self.count;
## 第三步定义find函数，其中要实现路径压缩（在find是所有访问的节点的父节点都指向最终root节点 ）；
## 第四步定义union函数，其中要实现根据按秩合并(让rank小的root指向rank大的root)，有需要的话要在合并时对self.count 进行- 1；