# 题目：最小的k个数
输入n个整数，找出其中最小的k个数。  

## 思路：
最简单的做法就是先将输入的n个整数排序，排序之后最前面的k个数就是最小的k个数，自然算法复杂度就是$O(nlogn)$。但这不是最优的算法。  
接下来介绍两个效率要求不同的两个解法。  

### 解法一：时间复杂度$O(n)$，但要求可以修改输入的数组
同样可以基于$Partition$函数来解决这个问题。如果基于数组的第k个数字来调整，则使得比第k个数字小的所有数字都位于数组的左边，比第k个数字大的所有数字都位于数组的右边。这样调整之后，位于数组中左边的k个数字就是最小的k个数字（这k个数字不一定是有序的）。  
这一题充分利用了快速排序的思想，并且采用$Partition$函数这一利器，很多算法都可以考虑这个函数来实现，但有个问题就是这个函数会对数组进行修改，所以采用前还是要确定一下可不可以对数组进行修改。  
$Partition$函数的实现介绍可以看notebook中排序算法介绍快速排序的部分。


### 解法二：时间复杂度$O(nlogk)$，适合处理海量数据（未完成）
先创建一个大小为k的数据容器来存储最小的k个数字，接下来每次从输入的n个整数读入一个数。如果容器中已有的数字少于k个，则直接把这次读入的整数放入容器之中；如果容器中已有k个数字了，就是说容器满了，因此这次只能替换容器中已有的数字。  
找出这k个数字中的最大值，然后拿这次待插入的整数和最大值进行比较，如果要插入的数字比容器中最大的数字小，说明最大的那个数字不应该在容器中，因此将两者交换；反之，如果比最大值还要大，自然也没必要加入到容器中。  
总的来说，当容器满了之后，我们要做3件事情：第一是在k个整数中找到最大数，第二是有可能在这个容器中删除最大数，第三是有可能要插入一个新的数字。如果用一棵二叉树来实现这个数据容器，我们就能在$O(logk)$时间内来实现这3步操作。因此对n个输入数字来说，总的时间效率就是$O(nlogk)$。  
这里的二叉树，我们可以选择红黑树或者最大堆来实现。  
https://www.cnblogs.com/yanmk/p/9222971.html  
这个算法的实现依赖于红黑树、最大堆的构造，从头到尾构造这样的数据结构还是要花一定时间的，python有包可以实现，如果可以用，直接用，否则就就从头搭建。因为我还没完整学号最大堆和红黑树的数据结构，等学完了再来补充。

#### 解法一：利用$Parition$函数

In [55]:
import random
class Solution1:
    def GetLeastNumbers(self,data,k):
        #assert (data is None or k<=0 or k>len(data)),'Invalid Input'
        start = 0
        end = len(data)-1
        index = self.partition(data,start,end)
        #index左边的元素都小于index位置上的元素
        
        if index is None:
            print('asfasfa')
            
        while index!=k-1:#如果刚好index在k-1位置上，index的元素正好符合题目的要求
            if index>k-1:
                end=index
                index = self.partition(data,start,end)
            else:
                start=index
                index = self.partition(data,start,end)
                
        res = [None]*k
        for i in range(k):
            res[i]=data[i]
        return res
        
    def partition(self,data,start,end):
        if data is None or len(data)==0 or start<0 or end>=len(data):
            print('Invalid Input.')
            return 0
        index = random.randint(start,end)
        data[index],data[end]=data[end],data[index]
        small = start-1
        for index in range(start,end):
            if data[index]<data[end]:
                small+=1
                if small!=index:
                    self.swap(data,index,small)
        small+=1
        self.swap(data,small,end)
        return small
    
    def swap(self,data,i,j):
        data[i],data[j]=data[j],data[i]

##### test:

In [59]:
Solution1().GetLeastNumbers(data=[1,2,3,10,20,15,0,4,5,6,7],k=5)

[1, 2, 0, 3, 4]

#### 解法二：利用最大堆或者红黑树
待完成