### 2.1 众数

#### 一. 众数的概念
1. 何为众数 :    
 1. 在任一无序向量$A$中, 若有一半以上的元素值为m, 则称m为向量$A$的众数  
 [注] : 3在向量$\left\{ 5,3,9,3,1,2,3,3 \right\} $虽然最多(4/8), 但没超过一半, 所以不是众数
 
#### 二. 众数查找
1. 如果向量存在众数, 则其对应的有序向量, 该众数一定是其中位数  
 因为如果众数不是中位数, 则被众数分割的向量两端, 都必存在众数, 这与向量的有序性相违背 
2. 如何找到众数  
  1. 基于以上思路, 我们首先找到有序向量的中位数`majEleCandidate`,   
  2. 再看这个中位数是否满足众数的要求`majEleCheck`: 在线性时间内扫描一遍向量, 统计该中位数出现的次数  
  2. 若满足, 则找到众数, 否则不存在众数
  
3. 众数的减而治之  
  1. 众数的另一个性质 :   
   设$p$为无序向量$A$中, 长度为$2m$的前缀向量. 则若$p$中元素$x$恰好出现$m次$($p$长度的一半), 则其后缀$A-P$的众数必为$A$的众数  
  2. 减而治之的中位数选取算法  
    1. 基于以上思想, 引入计数器c, 记录maj与其他元素的数额差距. 
    2. 经过线性时间, 以此设maj为后缀响亮的首个元素.
    3. 每当计数器c归0, 则意味着前缀可以被减除

In [10]:
def majelecandidate(l):
    '''基于前缀减除的众数候选者选取'''
    c = 0 # 计数器, 记录maj与其他元素的数量差额
    for i in range(0,len(l)):
        if c==0: # c归0时,前缀可以减除
            maj = l[i] # 众数候选者为当前元素
            c = 1 # maj与其他元素的个数差额变为1
        else:
            if maj == l[i]:
                c = c+1
            else:
                c = c-1
    return maj

#test
majelecandidate([6,2,6,1,4])

4

In [11]:
def majelecheck(l,candidate):
    '''线性时间检查后选择是否为众数'''
    count = 0
    for elem in l:
        if elem == candidate:
            count = count+1
    # 看maj的个数是否超过了列表的一半
    return count*2 > len(l)

In [14]:
if __name__=="__main__":
    l = [2,3,61,43,1,2,2,2]
    candidate = majelecandidate(l)
    print('candidate: ',candidate)
    flag = majelecheck(l,candidate)
    print(flag)

candidate:  2
False


### 2.2 归并向量的中位数

#### 一. 问题描述  
 给定2个有序向量, 如何找出它们归并后所得的有序向量$S={ S }_{ 1 }\cup { S }_{ 2 }$的中位数
 
#### 二. 解决办法
1. 蛮力法  
  1. 可使用归并排序, 将2个有序子序列合并成1个大的有序列表$S$, 然后取元素$S\left[ \left\lfloor \frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 }  \right\rfloor  \right] $
  2. 缺点是 :   
   没有充分利用2个子序列已经有序的条件

In [22]:
import math
def trivalMedian(s1,s2):
    '''蛮力归并排序法,找到中位数 (适用于2个序列很短的情况)'''
    i=0;j=0
    s = []
    m = len(s1)
    n = len(s2)
    while i<m and j<n:
        if(s1[i]<=s2[j]):
            s.append(s1[i])
            i = i+1
        else:
            s.append(s2[j])
            j = j+1
    while i<m:
        s.append(s1[i])
        i = i+1
    while j<n:
        s.append(s2[j])
        j = j+1
    # math.floor向下取整
    return s[math.floor((m+n)/2)]

trivalMedian([1,2,3],[2,3,4])

3