<a href="https://colab.research.google.com/github/niikun/Data-Structure/blob/main/Disjoint_Sets.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Disjoint Sets

Disjoint Setsは、集合が互いに共通する要素を持たない場合、その集合同士は互いに素である（Disjoint）と言います。  
例えば、次の2つの集合を考えます。

- 集合 𝐴={1,2,3}
- 集合 𝐵={4,5,6}  

この場合、集合
𝐴 と
𝐵 は一切の共通要素を持たないため、これらの集合は互いに素です。



## Union-Findデータ構造  
Disjoint Setsを効率的に扱うためのデータ構造として、Union-Find（またはDisjoint Set Union, DSU）というものがあります。Union-Findは、「友達グループ」を管理する方法です。友達になるとグループができ、どの子どもがどのグループにいるかを確認することができます。そして、さらに友達を増やしてグループを大きくすることもできます。この方法を使うと、大きなグループができても誰がどのグループにいるかを簡単に調べることができます。

- Union: 2つの集合を一つに統合する。  
- Find: ある要素がどの集合に属しているかを見つける。
Union-Findの具体的な操作
- Find:
各要素はそれぞれ代表（親）を持ち、同じ集合の要素は同じ代表を共有します。この代表を見つける操作がFindです。

- Union:
2つの要素が属する集合を一つにまとめる操作です。通常は、それぞれの集合の代表を比較し、片方を他方の代表に変更することで実現されます。  

パス圧縮とランク付け
Union-Findの効率を向上させるために、次の2つの技法が使われます。

- パス圧縮（Path Compression）:  
Find操作を行う際に、探索した全てのノードを直接その代表に繋ぎ直すことで、後のFind操作を高速化します。

- ランク付け（Union by Rank）:  
Union操作を行う際に、集合の「高さ」を考慮して、低い方の集合を高い方に結合します。これにより、全体の木の高さが抑えられ、Find操作が高速化されます。

In [None]:
class UnionFind:
    def __init__(self, size):
        self.parent = list(range(size))
        self.rank = [0] * size

    def __repr__(self):
        return f"{self.parent}, {self.rank}"

    def Find(self,p):
        if self.parent[p] !=p:
            self.parent[p] = self.Find(self.parent[p])
        return self.parent[p]

    def Union(self,p,q):
        rootP = self.Find(p)
        rootQ = self.Find(q)
        if rootP != rootQ:
            if self.rank[rootP] > self.rank[rootQ]:
                self.parent[rootQ] = rootP
            elif self.rank[rootP] < self.rank[rootQ]:
                self.parent[rootP] = rootQ
            else:
                self.parent[rootQ] =rootP
                self.rank[rootP] += 1

```
def __init__(self, size):
    self.parent = list(range(size))
    self.rank = [0] * size

```  
__init__関数: Union-Findの初期設定を行います。  

- self.parentは、各子どもがどのグループに属しているかを示すリストです。最初は全員が一人ぼっち（自分自身を親とする）です。  
- self.rankは、グループの「高さ」を示します。最初は全員が一人ぼっちなので、全て0です。

```
def find(self, p):
    if self.parent[p] != p:
        self.parent[p] = self.find(self.parent[p])
    return self.parent[p]

```
find関数: ある子どもがどのグループに属しているかを確認します。  
- if self.parent[p] != pの部分では、子どもpが自分自身を親としていない場合（つまり、グループに属している場合）に、その親を再帰的に探します。  
- self.parent[p] = self.find(self.parent[p])では、見つけた親を直接設定してパス圧縮を行います。  
- 最終的に、子どもpのグループの親を返します。

```
def union(self, p, q):
    rootP = self.find(p)
    rootQ = self.find(q)
    if rootP != rootQ:
        if self.rank[rootP] > self.rank[rootQ]:
            self.parent[rootQ] = rootP
        elif self.rank[rootP] < self.rank[rootQ]:
            self.parent[rootP] = rootQ
        else:
            self.parent[rootQ] = rootP
            self.rank[rootP] += 1
```
union関数: 2つの子どもpとqのグループを統合します。  
- rootP = self.find(p)とrootQ = self.find(q)で、それぞれのグループの親を見つけます。  
- if rootP != rootQでは、pとqが異なるグループに属している場合に統合を行います。  
- if self.rank[rootP] > self.rank[rootQ]では、高さが高い方に低い方のグループを結合します。  
- elif self.rank[rootP] < self.rank[rootQ]では逆の操作を行います。  
- elseでは、両方の高さが同じ場合に一方を他方に結合し、結合した側の高さを1増やします。

In [None]:
uf = UnionFind(10)
uf

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

In [None]:
uf.union(1,2)
uf

[0, 1, 1, 3, 4, 5, 6, 7, 8, 9], [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]

In [None]:
uf.union(3, 4)
uf

[0, 1, 1, 3, 3, 5, 6, 7, 8, 9], [0, 1, 0, 1, 0, 0, 0, 0, 0, 0]

In [None]:
uf.union(1, 4)
uf

[0, 1, 1, 1, 3, 5, 6, 7, 8, 9], [0, 2, 0, 1, 0, 0, 0, 0, 0, 0]

In [None]:
uf.find(4)
uf

[0, 1, 1, 1, 1, 5, 6, 7, 8, 9], [0, 2, 0, 1, 0, 0, 0, 0, 0, 0]

Union-Findの操作では、パス圧縮によって効率的に親を更新します。union(1, 4)の操作時には、直接的にすべての親を更新しませんが、次回のfind操作でパス圧縮が適用され、すべての親が直接更新されます。そのため、最初のunion

## Path Compression(パス圧縮）  
Path Compression（パス圧縮）は、友達グループの親を探す時に、経由する全ての子どもを直接親に繋ぎ直すことで、次回以降の検索を高速化する方法です。これにより、友達グループの管理がもっと早く、効率的になります。

In [None]:
uf = UnionFind(13)
uf

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

In [None]:
uf.Union(2, 10)
uf.Union(7, 5)
uf.Union(6, 1)
uf.Union(3, 4)
uf.Union(5, 11)
uf.Union(7, 8)
uf.Union(7, 3)
uf.Union(12, 2)
uf.Union(9, 6)

In [None]:
uf

[0, 6, 2, 7, 3, 7, 6, 7, 7, 6, 2, 7, 2], [0, 0, 1, 1, 0, 0, 1, 2, 0, 0, 0, 0, 0]

In [None]:
uf = UnionFind(4)
uf

[0, 1, 2, 3], [0, 0, 0, 0]

In [None]:
for i in range(1,3):
    uf.Union(i,i+1)
uf


[0, 0, 0, 0], [1, 0, 0, 0]

In [None]:
def MakeSet(n):
    parent = list(range(n))
    rank = [0] * n
    return parent, rank

def Find(parent, x):
    if parent[x] != x:
        parent[x] = Find(parent, parent[x])
    return parent[x]
def Union(parent, rank, x, y):
    rootX = Find(parent, x)
    rootY = Find(parent, y)
    if rootX != rootY:
        if rank[rootX] > rank[rootY]:
            parent[rootY] = rootX
        else:
            parent[rootX] = rootY
            if rank[rootX] == rank[rootY]:
                rank[rootY] += 1

In [None]:
for i in range(1,12):
  MakeSet(i)
Union(2, 10)
Union(7, 5)
Union(6, 1)
Union(3, 4)
Union(5, 11)
Union(7, 8)
Union(7, 3)
Union(12, 2)
Union(9, 6)

TypeError: Union() missing 2 required positional arguments: 'x' and 'y'