### 一、归并排序中的分治思想

#### 如何使用递归编程解决数字的排序问题？

#### 1.归并排序（merge sort）
对于数字排序，有很多优秀的算法，比如归并排序、快速排序、堆排序等，其中，归并排序和快速排序很好的体现列分治思想。  
归并排序的核心就是“归并”，也就是把两个有序的数列合并起来，形成一个更大的有序数列。  
思路：  

+ 假设我们需要从小到大合并两个有序数列A和B。
+ 这里我们需要新的存储空间C，用于保存合并后的结果。
+ 对比两个数列中的第一个数，小的放入C，并在原数列中删除，依次类推
+ 直到A和B有一个的数全部被取出，将另一个数列的数据依次取出放入C中  

问题一：  

等待排序的数组一开始就是乱的，那归并又有什么意义呢？  
还记得递归吗？我们可以利用递归的思想，把问题不断简化，也就是不断简化数列至只剩下1个数，这样就是有序的。

问题二：

每一次如何简化问题呢？如果把长度为n的数列每次简化为长度n-1的数列，这样效率会很低。
所以我们可以在归并排序中引入分而治之的思想。

#### 2.分而治之（Divide and Conquer）

分而治之，我们通常称为分治。他的思想就是，将一个复杂的问题，分解成两个甚至多个规模相同的类似子问题，然后对这些子问题再进一步细分，直到最后的子问题变得很简单，很容易就被求解出来，这样就求解出了复杂问题

归并排序通过分而治之的 思想，把长度为n的数列，每次简化为两个长度为n/2的数列。这更有利于计算机的并行处理，只需要log2n次归并。

#### 3.归并排序、分而治之和递归有什么关系呢？
#### 归并排序使用列分治的思想，而这个过程需要使用递归来实现
分治的过程，就是用同一规则将复杂问题不断拆分并在达到最简单状态时返回的过程，这个过程最直观的实现方式就是递归。

In [49]:
class Lesson6_1:
          
    def merge_sort(self,to_sort):
        """
        @Description:使用函数的递归（嵌套）调用，实现归并排序（从小到大）
        @param to_sort-等待排序的数组
        @return int[]-排序后的数组
        """
        if not to_sort:
            return 0
        #如果分解到只剩一个数，返回该数
        if (len(to_sort) == 1):
            return to_sort

        #将数组分解成左右两半
        mid = len(to_sort) // 2
        left = to_sort[0:mid].copy()
        right = to_sort[mid:len(to_sort)].copy()

        #嵌套调用，对两半分别进行排序
        left = self.merge_sort(left)
        right = self.merge_sort(right)

        #合并排序后的两半
        merged = self.merge(left, right)

        return merged

    def merge(self, a, b):
        """
        @Description:合并两个已经排序完毕的数组（从小到大）
        @param a-第一个数组，b-第二个数组
        @return int[]-合并后的数组
        """
        if not a:
            a = 0
        if not b:
            b = 0
        
        merged_one = list(range(len(a) + len(b)))
        mi, ai, bi = 0, 0, 0
        
        #轮流从两个数组中取出较小的值，放入合并后的数组中
        while (ai < len(a) and bi < len(b)):
            if a[ai] <= b[bi]:
                merged_one[mi] = a[ai]
                ai += 1
            else:
                merged_one[mi] = b[bi]
                bi += 1
            mi += 1
            
        #将某个数组内剩余的数字放入合并后的数组中
        if (ai < len(a)):
            for i in range(ai, len(a)):
                merged_one[mi] = a[i]
                mi += 1
        else:
            for i in range(bi, len(b)):
                merged_one[mi] = b[i]
                mi += 1
        return merged_one
    
if __name__ == '__main__':
    to_sort = [3434, 3356, 67, 12334, 878667, 387, 983]
    sort = Lesson6_1()
    sort_obj = sort.merge_sort(to_sort)
    for i in range(len(sort_obj)):
        print(sort_obj[i])

67
387
983
3356
3434
12334
878667


### 二、分布式系统中的分治思想
#### 分而治之更有趣的应用其实是在分布式系统中

当需要排序的数组很大，远超过一台普通机器的内存时，我们需要把这个超级大的数据分解为多个小的数据集，分配到多台机器中并行处理，等所有机器处理完成后，中央服务器再进行结果合并。

在单台机器上实现归并排序时，我们只需要在递归函数内实现数据分组及合并就可以了，而多个机器之间分配数据的时候，递归函数除了分组和合并，还要负责把数据分发到某台机器上。