# 非参数检验

## 检验单个总体位置
1. 使用的统计量是符合二项分布的
2. 因此显著性水平p值即为二项分布pmf的响应x值

## 活性细菌总数符号检验

In [7]:
import numpy as np
import pandas as pd
from scipy import stats
import math
from matplotlib import pyplot as plt

def sign_test(data, miu, alpha=0.05):
    n = len(data)
    pos = 0
    neg = 0
    for i in range(len(data)):
        if data[i] > miu:
            pos +=1
        else:
            neg +=1
    if (pos+neg) != n:
        return -1
    return 1 - stats.binom.cdf(max(pos,neg),n,0.5)

bacteria_data = [41,33,43,52,46,37,44,39,53,30]


p = sign_test(bacteria_data, 40)
p

0.171875

# 比较两个总体
1. 威尔克森秩和检验<br>
原假设$H_0$: 两总体统计量相等<br>
备择假设$H_1$： 两总体统计量不等，一个大于另一个为单边检验；两个不等为双边检验<br>
2. 当$n_1,n_2\le10$时，使用查表的方法，表格来自于古典概型
3. 当$n_1,n_2>10$时，使用标准正态分布Z作为枢轴统计量
$$
\begin{array}{ll}
    E[T_1] = \frac{n_1n_2+n_1(n_1+1)}{2} \\
    V[T_1] = \frac{n_1n_2+n_1(n_1+n_2+1)}{2} \\
    Z = \frac{T_1-E[T_1]}{\sqrt{V[T_1]}}
\end{array}
$$