layout | title | categories | tags | keywords | description | order |
---|---|---|---|---|---|---|
post |
【统计推断】理论与实现 |
0x41_统计模型 |
406 |
第一类错误:H0为真,但错误地拒绝了H0
第二类错误:H0为假,但错误地接受了H0
用公式表示就是
- 第一类错误$\alpha=P(x \in w \mid H_0)$
- 第二类错误$\beta=P(x \in w \mid H_1)$
大图见于这里
<iframe src="https://www.guofei.site/StatisticsBlog/HypothesisTesting.htm" width="100%" height="1600em" marginwidth="10%"></iframe>大图见于这里
用excel来存这个知识,始终别扭,现在把其中一部分重新在这里写一写。
名字 | H0 | 前提条件 | 构建随机变量 | 服从分布 | 代码 | 备注 |
---|---|---|---|---|---|---|
单因子方差分析 ANOVA | u1=u2=...=ur | 独立、正态、等方差 |
=SSE(组内误差)+SSA(组间误差) |
tstat, pvalue = stats.f_oneway(data1, data2, data3) from statsmodels.formula.api import ols sm.stats.anova_lm(ols('target ~ C(motor)',data=df).fit()) |
参考
先定义命名和数据:
- 序号i表示在A因素中的标号,总共a个
- 序号j表示在B因素中的标号,总共b个
- 序号j表示在AB因素相同时,多次抽取的样本的标号。然后假设每组数量都一样,都是n个
H0:$\alpha_i=0,\beta_j=0,\forall i,j$
那么,
方差来源 | 公式 | 若H0成立,那么 | F统计量 |
---|---|---|---|
因子A | |||
因子B | |||
因子A×B | |||
组内误差 | |||
总和 | SST=SSA+SSB+SSAB+SSE |
sm.stats.anova_lm(ols('target ~ C(motor) + C(screw)',data=df).fit())
带交互项:<br> ana = ols('target ~ C(motor) + C(screw) +C(motor)*C(screw)', data= df).fit()
sm.stats.anova_lm(ana)
大网页见于这里
<iframe src="https://www.guofei.site/StatisticsBlog/%E7%BB%9F%E8%AE%A1%E6%8E%A8%E6%96%AD%E5%9F%BA%E7%A1%80.html" width="100%" height="1600em" marginwidth="10%"></iframe>大网页见于这里
kstest 不但可以传入指定的分布字符串(上文),也可以传入一个分布对象(如下)
stats.kstest(rvs=[1, 2, 3, 4, 5], cdf='norm')
stats.kstest(rvs=[1, 2, 3, 4, 5], cdf=stats.norm(loc=0, scale=1).cdf)