## 假设检验
### t检验
#### 单样本t检验
研究对象：均值
研究目标：均值是否与某个值存在差异

零假设：模型A的平均精度是0.9
备择假设：模型A的平均精度不是0.9

In [1]:
# 用于数值计算的库
import numpy as np
import pandas as pd
import scipy as sp
from scipy import stats

# 用于绘图的库
from matplotlib import pyplot as plt
import seaborn as sns
sns.set()

# 在Jupyter Notebook里显示图形
%matplotlib inline


In [2]:
rice_weight = pd.read_csv("model-A-one-sample-t-test.csv")["accuracy"]
rice_weight.head()

0    0.93
1    0.89
2    0.90
3    0.88
4    0.94
Name: accuracy, dtype: float64

In [3]:
# 计算样本均值
mu = np.mean(rice_weight)
mu

0.917

In [4]:
# 自由度
df = len(rice_weight) - 1
df

9

In [5]:
# 计算标准偏差
sigma = np.std(rice_weight, ddof = 1)
# t值计算公式的分母
se = sigma / np.sqrt(len(rice_weight))
se

0.006999999999999997

In [6]:
# 计算t值
t_value = abs(mu - 0.9) / se
t_value

2.428571428571432

In [7]:
# 计算临界t值
# ppf(percent point function)是cdf(cumulative distribution function)的逆函数
critical_t_value = stats.t.ppf(1 - 0.025, 9)
critical_t_value

2.2621571627409915

In [8]:
if t_value >= critical_t_value:
    print("拒绝零假设，即，模型A的平均精度不是0.9")
else:
    print("接受零假设，即，模型A的平均精度是0.9")

拒绝零假设，即，模型A的平均精度不是0.9


In [9]:
# 计算p值，即，由t分布的累积分布函数计算得到总体均值为50时的概率
alpha_Ave = stats.t.cdf(t_value, df = df)
p_value = (1 -  alpha_Ave) * 2
p_value 

0.038071655004727534

In [10]:
# 校对组
t_value_proof, p_value_proof = stats.ttest_1samp(rice_weight, 0.9)
t_value_proof, p_value_proof

(2.428571428571432, 0.038071655004727686)

In [11]:
alpha = 0.05
if p_value <= alpha:
    print("拒绝零假设，即，模型A的平均精度不是0.9")
else:
    print("接受零假设，即，模型A的平均精度是0.9")

拒绝零假设，即，模型A的平均精度不是0.9


### 配对样本t检验
零假设：两个模型的精度不存在显著性差异
备择假设；两个模型的精度存在显著性差异
显著性水平：0.05


In [12]:
weight_paired_test_data = pd.read_csv("accuracy-paired-t-test.csv")
print(weight_paired_test_data)

   index  model_A  model_B
0      1     0.93     0.90
1      2     0.89     0.88
2      3     0.90     0.89
3      4     0.88     0.92
4      5     0.94     0.91
5      6     0.93     0.90
6      7     0.92     0.87
7      8     0.95     0.89
8      9     0.91     0.92
9     10     0.92     0.91


In [22]:
# 样本数组
rice_weight_A = weight_paired_test_data["model_A"]
rice_weight_B = weight_paired_test_data["model_B"]
# 转化为数组型
rice_weight_A = np.array(rice_weight_A)
rice_weight_B = np.array(rice_weight_B)
# 计算差值
diff = rice_weight_A - rice_weight_B
diff

array([ 0.03,  0.01,  0.01, -0.04,  0.03,  0.03,  0.05,  0.06, -0.01,
        0.01])

In [23]:
# 进行单样本t检验
stats.ttest_1samp(diff, 0)

Ttest_1sampResult(statistic=1.9639610121239308, pvalue=0.08112618884584076)

In [24]:
# stats中的配对样本t检验方法，直接计算配对样本t检验的t值和p值
paired_tvalue, paried_pvalue = stats.ttest_rel(rice_weight_B, rice_weight_A)
paired_tvalue, paried_pvalue

(-1.9639610121239308, 0.08112618884584076)

In [25]:
# 按公式计算p值
paired_alpha = stats.t.cdf(abs(paired_tvalue), df = 9)
paired_p_value = (1 -  paired_alpha) * 2
paired_p_value 

0.08112618884584077

In [26]:
if paired_p_value  <= alpha:
    print("拒绝零假设，即，两个模型的精度存在显著性差异")
else:
    print("接受零假设，即，两个模型的精度不存在显著性差异")

接受零假设，即，两个模型的精度不存在显著性差异
