# 分治法

## 解决问题的三种方法
**1. 有粗到精的松弛技术**  
 *割圆法求解圆周率，使用正多边形不断逼近圆面积；迭代法解线性方程组*  
 ![xbxbxn](../data/pi.png "xxx")
**2. 由难到易的校正技术**    
 *使用泰勒公式分解为多项式研究复杂函数*  
**3. 有大到小的分治技术**    
 *将大规模的问题缩减规模到常数级别*

## 分治法的原理
1. 该问题的规模缩小到一定的程度就可以容易地解决；
2. 该问题可以分解为若干个规模较小的相同问题，即该问题具有最优子结构性质；
3. 利用该问题分解出的子问题的解可以合并为该问题的解,包括存储结构上的合并，以及数值结果的运算合并；
4. 该问题所分解出的各个子问题是相互独立的，即子问题之间不包含公共的子问题。  

第一、二条要求是“分”的阶段，在大多数情况下，把问题规模缩小到一定程度就会得到非常简单的解；第三条是分治法能否得到问题最终解的关键，如果第三点不能得到满足，则前面的“分”就没有意义，这步实现的合并操作可以视为局部的最优解或者全局最优解的一部分；若第四步不能满足，则一般使用动态规划来解决问题，继续分治可能会使编程实现的难度陡增。

## 算法案例
|           算法案例 |      时间复杂度|
|------------------|---------------|
|二分检索            |$O_{(N\lg(N))}$|
|归并排序            |$O_{(N\lg(N))}$  |
|快速排序            |$O_{(N\lg(N))}$   |
|矩阵相乘            |$O_{(N^{2.807})}$  |

In [1]:
import numpy as np

### 二分检索 

In [2]:
def binary_search(sorted_data, item):
    """
    type sorted_data:[]
    type item:data
    rtype int
    """
    lens = len(sorted_data)
    if sorted_data == None or lens == 0:
        return -2
    lower , higher = 0 , lens-1
    item_index = -1
    while lower <= higher:
        middle = lower+(higher - lower)/2
        if sorted_data[middle] < item:
            lower = middle+1
            continue
        elif sorted_data[middle] > item:
            higher = middle-1
            continue
        else:
            item_index = middle
            break
    return item_index

### 归并排序

In [3]:
def merge(unsorted_data,lower,middle,higher):
    """
    type unsorted_data:list
    type lower:int
    type higher:int
    type middle:int
    """
    temp_list = []*(higher-lower+1)
    i , j = lower , middle+1
    while i <= middle and j <= higher:
        if unsorted_data[i] < unsorted_data[j]:
            temp_list.append(unsorted_data[i])
            i +=1
        else:
            temp_list.append(unsorted_data[j])
            j +=1
    if i <= middle:
        for ii in range(i,middle+1,1):
            temp_list.append(unsorted_data[ii])
    elif j <= higher:
        for jj in  range(j,higher+1,1):
            temp_list.append(unsorted_data[jj])
    for item in temp_list:
        unsorted_data[lower] = item
        lower += 1
def m_sort(unsorted_data,lower,higher):
    """
    type unsorted_data:list
    type lower:int
    type higher:int
    """
    if lower >= higher:
        return
    else:
        middle = lower + (higher-lower)/2
        m_sort(unsorted_data,lower,middle)
        m_sort(unsorted_data,middle+1,higher)
        merge(unsorted_data,lower,middle,higher)
def merge_sort(unsorted_data):
    """
    type s:list
    rtype:list
    """
    if unsorted_data == None:
        return None
    lens = len(unsorted_data)
    if lens == 0 or lens == 1:
        return unsorted_data
    else:
        m_sort(unsorted_data,0,lens-1)
        return unsorted_data

### 快速排序 

In [4]:
def q_sort(unsorted_data,lower,higher):
    """
    type unsorted_data:list
    type lower:int
    type higher:int
    """
    if lower >= higher:
        return
    else:
        cur_index = np.random.randint(lower,higher+1)
        swap(unsorted_data,lower,cur_index)
        
        i , j = lower , higher
        while i <= j:
            while j >= lower:
                if unsorted_data[j] > unsorted_data[lower]:
                    j -= 1
                else:
                    break
            while i <= higher:
                if unsorted_data[i] <= unsorted_data[lower]:
                    i += 1
                else:
                    break
            if i < j:
                swap(unsorted_data,i,j)
                i += 1
                j -= 1
        swap(unsorted_data,j,lower)
        q_sort(unsorted_data,lower,j-1)
        q_sort(unsorted_data,j+1,higher)
        
def quick_sort(unsorted_data):
    """
    type s:list
    rtype:list
    """
    if unsorted_data == None:
        return None
    lens = len(unsorted_data)
    if lens == 0 or lens == 1:
        return unsorted_data
    else:
        q_sort(unsorted_data,0,lens-1)
        return unsorted_data

### Strassen矩阵乘法 

Strassen矩阵乘法能够减少“蛮力法”使用的乘法次数，当相乘的两个矩阵都是$2\times2$的规模时，可以使用如下公式代替“蛮力法”，更大规模矩阵乘法的基础：
$$\begin{equation}
\begin{aligned}
\left[
  \begin{matrix}
   c_{00} & c_{01}\\
   c_{10} & c_{11} 
  \end{matrix} 
  \right] &=
  \left[
  \begin{matrix}
   a_{00} & a_{01}\\
   a_{10} & a_{11} 
  \end{matrix} 
  \right]
  \left[
  \begin{matrix}
   b_{00} & b_{01}\\
   b_{10} & b_{11} 
  \end{matrix} 
  \right] \\
  &=\left[
  \begin{matrix}
  m_{1}+m_{4}-m_{5}+m_{7} & m_{3}+m_{5}\\
  m_{2}+m_{4} & m_{1}+m_{3}-m_{2}+m_{6}
  \end{matrix}
  \right]
  \end{aligned}
  \end{equation}
$$
其中，
$$
\begin{aligned}
m_{1} &= (a_{00}+a_{11})\times(b_{00}+b_{11})\\
m_{2} &= (a_{10}+a_{11})\times b_{00} \\
m_{3} &= a_{00} \times(b_{01}-b_{11})\\
m_{4} &= a_{11}\times(b_{10}-b_{00})\\
m_{5} &= (a_{00}+a_{01})\times b_{11} \\
m_{6} &= (a_{10}-a_{00})\times(b_{00}+b_{01})\\
m_{7} &= (a_{01}-a_{11})\times(b_{10}+b_{11})
\end{aligned}
$$  

为了确保最小规模的矩阵规模为$2\times2$,可以补充全为0的行、列使矩阵的规模为$2^{n}\times 2^{n}$,然后使用如下分块矩阵的方法递归减小矩阵规模为$2\times2$  
$$\begin{equation}
\left[
  \begin{array}{c|c}
   C_{00} & C_{01}\\ \hline
   C_{10} & C_{11} 
  \end{array} 
  \right] =
  \left[
  \begin{array}{c|c}
   A_{00} & A_{01}\\ \hline
   A_{10} & A_{11} 
  \end{array} 
  \right]
  \left[
  \begin{array}{c|c}
   B_{00} & B_{01}\\ \hline
   B_{10} & B_{11} 
  \end{array}
  \right] 
  \end{equation}
$$  
其中，矩阵$A、B、C$均是第一代矩阵，规模为$2^{n}\times 2^{n}$，经过一次“分”，形成四个规模为$2^{n-1}\times 2^{n-1}$的子问题，按照这种模式，最终只需要计算出最小规模的子问题$2\times 2$即可解决这个问题

In [5]:
def strassen_matrix(matrix_a, matrix_b, n):
    """
    type matrix_a:([[int]])
    type matrix_b:([[int]])
    type        n:int
    rtype        :([[int]])
    """
    if n == 2:
        m1 = (matrix_a[0,0]+matrix_a[1,1])*(matrix_b[0,0]+matrix_b[1,1])
        m2 = (matrix_a[1,0]+matrix_a[1,1])*matrix_b[0,0]
        m3 = matrix_a[0,0]*(matrix_b[0,1]-matrix_b[1,1])
        m4 = matrix_a[1,1]*(matrix_b[1,0]-matrix_b[0,0])
        m5 = (matrix_a[0,0]+matrix_a[0,1])*matrix_b[1,1]
        m6 = (matrix_a[1,0]-matrix_a[0,0])*(matrix_b[0,0]+matrix_b[0,1])
        m7 = (matrix_a[0,1]-matrix_a[1,1])*(matrix_b[1,0]+matrix_b[1,1])
        return np.array([[m1+m4-m5+m7,m3+m5],[m2+m4,m1+m3-m2+m6]])
    else:
        half_n = n/2
        
        # 传统的分块矩阵乘法
        """
        # a[0][0]*b[0][0] + a[0][1]*b[1][0]
        lu = strassen_matrix(matrix_a[:half_n,:half_n],matrix_b[:half_n,:half_n],half_n)+\
        strassen_matrix(matrix_a[:half_n,half_n:], matrix_b[half_n:,:half_n],half_n) # 左上角
        
        # a[0][0]*b[0][1] + a[0][1]*b[1][1]
        ru = strassen_matrix(matrix_a[:half_n,:half_n],matrix_b[:half_n,half_n:],half_n)+\
        strassen_matrix(matrix_a[:half_n,half_n:],matrix_b[half_n:,half_n:],half_n)       # 右上角
        
        # a[1][0]*b[0][0] + a[1][1]*b[1][0]
        lb = strassen_matrix(matrix_a[half_n:,:half_n],matrix_b[:half_n,:half_n],half_n)+\
        strassen_matrix(matrix_a[half_n:,half_n:],matrix_b[half_n:,:half_n],half_n)       # 左下角
        
        # a[1][0]*b[0][1] + a[1][1]*b[1][1]
        rb = strassen_matrix(matrix_a[half_n:,:half_n],matrix_b[:half_n,half_n:],half_n)+\
        strassen_matrix(matrix_a[half_n:,half_n:],matrix_b[half_n:,half_n:],half_n)       # 右下角
        
        left = np.concatenate((lu,lb),axis=0)
        right = np.concatenate((ru,rb),axis=0)
        """
        # strassen 算法
        m1 = strassen_matrix(matrix_a[:half_n,:half_n]+matrix_a[half_n:,half_n:], \
                             matrix_b[:half_n,:half_n]+matrix_b[half_n:,half_n:], half_n)
        m2 = strassen_matrix(matrix_a[half_n:,:half_n]+matrix_a[half_n:,half_n:],matrix_b[:half_n,:half_n],half_n)
        m3 = strassen_matrix(matrix_a[:half_n,:half_n],matrix_b[:half_n,half_n:]-matrix_b[half_n:,half_n:], half_n)
        m4 = strassen_matrix(matrix_a[half_n:,half_n:],matrix_b[half_n:,:half_n]-matrix_b[:half_n,:half_n], half_n)
        m5 = strassen_matrix(matrix_a[:half_n,:half_n]+matrix_a[:half_n,half_n:],matrix_b[half_n:,half_n:],half_n)
        m6 = strassen_matrix(matrix_a[half_n:,:half_n]-matrix_a[:half_n,:half_n], \
                             matrix_b[:half_n,:half_n]+matrix_b[:half_n,half_n:], half_n)
        m7 = strassen_matrix(matrix_a[:half_n,half_n:]-matrix_a[half_n:,half_n:], \
                             matrix_b[half_n:,:half_n]+matrix_b[half_n:,half_n:], half_n)
        left  = np.concatenate((m1+m4-m5+m7,m2+m4),axis=0)
        right = np.concatenate((m3+m5,m1+m3-m2+m6),axis=0)
        
        return np.concatenate((left,right),axis=1)

#### 测试 strassen 矩阵乘法 

In [6]:
n = 32
m_a = np.random.randint(low = -100, high = 100, size=(n,n))
m_b = np.random.randint(low = -100, high = 100, size=(n,n))

In [7]:
%time
np.dot(m_a, m_b)

CPU times: user 9 µs, sys: 0 ns, total: 9 µs
Wall time: 17.2 µs


array([[  8116,  13870, -46412, ..., -24571, -11941, -11526],
       [-20111,  -3274,  13696, ..., -16659,  27736,  24489],
       [ -8707,  10345,  28936, ...,  12737,   9160,  22919],
       ...,
       [  4812,   9317,   8430, ...,   7917,  -7086,  -4635],
       [  8387,  -2946,  18165, ...,   1637,  20055, -13284],
       [  1833,  35197, -37894, ..., -13250,   5265,   -514]])

In [8]:
%time
strassen_matrix(m_a, m_b, n)

CPU times: user 15 µs, sys: 4 µs, total: 19 µs
Wall time: 37.9 µs


array([[  8116,  13870, -46412, ..., -24571, -11941, -11526],
       [-20111,  -3274,  13696, ..., -16659,  27736,  24489],
       [ -8707,  10345,  28936, ...,  12737,   9160,  22919],
       ...,
       [  4812,   9317,   8430, ...,   7917,  -7086,  -4635],
       [  8387,  -2946,  18165, ...,   1637,  20055, -13284],
       [  1833,  35197, -37894, ..., -13250,   5265,   -514]])

#### 时间复杂度分析 

根据上述的Strassen 算法的实现，可以假设 $M_{n}$ 是执行两个 $n$ 阶矩阵相乘时的数值乘法次数，则相当于通过递归调用7个 $n/2$ 阶的矩阵相乘(递归部分m1-m7)，所以可得
$$M_{n}= 
\begin{cases}
7M_{n/2} & \text{n>1} \\
1        & \text{n=1}
\end{cases}$$
且由Strassen 算法得 $ n=2^{k} $,所以
$$\begin{aligned}
M_{2^{k}} &= 7M_{2^{k-1}} \\
&= 7^{2}M_{2^{k-2}}\\
&= \dots \\
&= 7^{k}M_{2^{k-k}} \\
&= 7^{k}\\
&= 7^{\lg{n}}\\
&= n^{\lg{7}}\\
&\approx n^{2.807}
\end{aligned}$$