# 统计量与P值的互相转换

正态分布与T分布都是对称分布，都有双尾和单尾检测的说法，计算方法类似
- scipy.stats.(t/norm)
- pdf: 概率密度函数

#### 计算统计量与P值用到的函数
- cdf: 累计概率密度函数，用来求P值
- sf: 1-cdf，用来求P值
- ppf: cdf的逆函数，用来求统计量/临界值
- isf: 1-cdf的逆函数，用来求统计量/临界值
- interval: 置信区间

| | 面积（概率值） | X轴 |
| --- | --- | --- |
| 真实值 | p_value(p值) | z_statistic(z统计量) |
| 阈值 | alpha(显著性水平:significance level) | critical_value(临界值) |
| 阈值 | 1-alpha(置信度:confidence coefficient) | critical_value(临界值) |
| 阈值 | 双边 0.05 | 1.96 |
| 阈值 | 单边 0.025 | 1.96 |
| 阈值区间 | 双边 0.05 | (-1.96, 1.96) |

<img src='resource/pvalue.gif' width=30%></img>

In [19]:
from scipy.stats import norm,t 

# z-statistic => p-value, 双边检测
# 知道x轴坐标的情况，怎么求面积
z_statistic = 1.96
p_value_1 = 2 * (1 - norm.cdf( abs(z_statistic) ))
p_value_2 = 2 * norm.sf( abs(z_statistic) )

# p-value => z-statistic（critical value）, 双边检测
# 知道面积的情况下，怎么获得x轴的坐标
p_value = 0.05
critical_value_1 = norm.ppf( 1 - abs(p_value)/2 )
critical_value_2 = norm.isf( abs(p_value)/2 )


print( z_statistic, p_value_1, p_value_2, critical_value_1, critical_value_2 )

# 置信区间
# dof>30的t分布近似norm分布
print( norm.interval(0.95), t.interval(0.95, 1), t.interval(0.95, 2), t.interval(0.95, 30), t.interval(0.95, 300), sep="\n" )

1.96 0.04999579029644097 0.04999579029644087 1.959963984540054 1.9599639845400545
(-1.959963984540054, 1.959963984540054)
(-12.706204736432095, 12.706204736432095)
(-4.302652729911275, 4.302652729911275)
(-2.0422724563012373, 2.0422724563012373)
(-1.9679030112607843, 1.9679030112607843)
