# CV 里的 connected component
原文: https://www.cnblogs.com/walter-xh/p/10171597.html


## 思路分析
* 代码思路:
    * 使用递归, 递归的 basecase 是 当前元素不需要进行标记, 此时返回 0, 表示当前元素没有进行标记操作, 被标记的元素数量为0
    

In [7]:
table = [[0,0,1,0,1,1,1,0],
        [0,0,1,0,0,1,1,0],
        [0,1,1,0,1,1,1,0],
        [0,0,1,0,1,0,0,0],
        [0,0,0,0,0,1,1,0],
        [0,0,0,0,1,1,1,0]]

rows = len(table)
cols = len(table[0])

# 生成与原矩阵大小相同的空矩阵, 不过这里不是嵌套list
label_table = []
for i in range(rows):
    col = cols*[0]
    label_table.append(col)

# 打印数组
def show(table):
    rows = len(table)
    cols = len(table[0])
    for i in range(rows):
        for j in range(cols):
            print(table[i][j], end=" ")
        print()


# 深度优先搜索
def dfs(i, j, mask):
    
    # 判断越界情况: i,j不能超过矩阵的行列数, label[i][j]不能为0 表示当前位置已经被标记, 不再进行递归; table[i][j]不能为1 表示当前位置元素不是1, 不再进行递归
    if i<0 or i>=rows or j<0 or j>=cols or \
        label_table[i][j]!=0 or \
        table[i][j]!=1:
        return 0                    # 0 表示当前位置没有被标记的元素
    
    # 给当前位置标记一下, mask 是用来描述当前label要标记的数字, 比如第2个连通域, mask 取值就是2
    label_table[i][j] = mask
    ret = 1                         # 存放当前遍历的区域中被标记的元素的数量
    
    #left right up down search      # 遍历完当前元素之后, 马上继续遍历当前元素的上下左右四个位置, 而不是遍历当前一行或者一列之后再遍历下一行或者下一列, 因此这里体现了 DFS 的思想
    ret+=dfs(i, j-1, mask)          # 遍历一下左边的一个位置, 用 += 实现被标记的元素数量的累加 
    ret+=dfs(i, j+1, mask)          # 遍历一下右边的一个位置, 用 += 实现被标记的元素数量的累加 
    ret+=dfs(i-1, j, mask)          # 遍历一下上边的一个位置, 用 += 实现被标记的元素数量的累加 
    ret+=dfs(i+1, j, mask)          # 遍历一下下边的一个位置, 用 += 实现被标记的元素数量的累加 

    return ret                      # 存放当前遍历的区域中被标记的元素的数量
    
if __name__ == "__main__":
    print("original table:")
    show(table)
    res={}
    print("++++++++++++++++++++")
    print("label table")
    mask = 1
    for i in range(rows):
        for j in range(cols):
            if table[i][j] == 1 and label_table[i][j] == 0:   # 当前元素是1, 并且没有被标记过
                ret = dfs(i,j, mask)
                res[mask] = ret
                mask+=1
               
    show(label_table)
    print("++++++++++++++++++++")
    print("results:")
    
    
    print("labeled results: %s"%res)
    
    sorted_res = [(k, res[k]) for k in sorted(res, key=res.get, reverse=True)]
    max_grp = sorted_res[0][0]
    print("max group num: %d"%sorted_res[0][1])

    for i in range(rows):
        for j in range(cols):
            if label_table[i][j] == max_grp:
                print("point (%d, %d) belongs to max group: %d"%(i,j,max_grp))

original table:
0 0 1 0 1 1 1 0 
0 0 1 0 0 1 1 0 
0 1 1 0 1 1 1 0 
0 0 1 0 1 0 0 0 
0 0 0 0 0 1 1 0 
0 0 0 0 1 1 1 0 
++++++++++++++++++++
label table
0 0 1 0 2 2 2 0 
0 0 1 0 0 2 2 0 
0 1 1 0 2 2 2 0 
0 0 1 0 2 0 0 0 
0 0 0 0 0 3 3 0 
0 0 0 0 3 3 3 0 
++++++++++++++++++++
results:
labeled results: {1: 5, 2: 9, 3: 5}
max group num: 9
point (0, 4) belongs to max group: 2
point (0, 5) belongs to max group: 2
point (0, 6) belongs to max group: 2
point (1, 5) belongs to max group: 2
point (1, 6) belongs to max group: 2
point (2, 4) belongs to max group: 2
point (2, 5) belongs to max group: 2
point (2, 6) belongs to max group: 2
point (3, 4) belongs to max group: 2
