# Параметрические гипотезы

### *Материал взят из лекций http://www.machinelearning.ru/wiki/images/3/3b/Psad_ht_parametric.pdf*

## *Z-критерий*

выборка: $\quad X^{n}=\left(X_{1}, \ldots, X_{n}\right), X \sim N\left(\mu, \sigma^{2}\right)$
$\sigma$ известна;

нулевая гипотеза: $H_{0}: \mu=\mu_{0}$;

альтернатива: $H_{1}: \mu<\neq>\mu_{0}$;

статистика: $\quad Z\left(X^{n}\right)=\frac{\bar{X}-\mu_{0}}{\sigma / \sqrt{n}} ;$
$Z\left(X^{n}\right) \sim N(0,1)$ при $H_{0} ;$


<span style="color:green">*Подход через P-value*:

достигаемый уровень значимости:
$$
p-value= \begin{cases}1-\operatorname{pnorm}(z, 0,1), & H_{1}: \mu>\mu_{0} \\ \text { pnorm }(z, 0,1), & H_{1}: \mu<\mu_{0} \\ 2(1-\operatorname{pnorm}(|z|, 0,1)), & H_{1}: \mu \neq \mu_{0}\end{cases}
$$
    
<span style="color:green">*Подход через значение статистики*:
    
$$
z_{critical}= \begin{cases}\operatorname{pnorm}(z_{critical}) =\frac{1-2\alpha}{2}, & H_{1}: \mu>\mu_{0}, (z>z_{critical})\\ 
\operatorname{pnorm}(z_{critical}) = -\frac{1-2\alpha}{2}, & H_{1}: \mu<\mu_{0}, (z<z_{critical}) \\ \operatorname{pnorm}(z_{critical}) =\frac{1-\alpha}{2}, & H_{1}: \mu \neq \mu_{0}, (z<z_{critical}^*, z>z_{critical}, z_{critical}^* = -z_{critical} )\end{cases}
$$
    
Вывод: https://natalibrilenova.ru/statisticheskie-gipotezyi/#%D0%9F%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5%20%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5%20%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D1%8B    

**Пример (Kanji, критерий 1):** линия по производству пудры должна обеспечивать средний вес пудры в упаковке 4 грамма, заявленное стандартное отклонение - 1 грамм.
В ходе инспекции выбрано 9 упаковок, средний вес продукта в них составляет $4.6$ грамма.

$H_{0}:$ средний вес пудры в упаковке соответствует норме.

$H_{1}:$ средний вес пудры в упаковке не соответствует норме $\Rightarrow p=0.0719$,

95\% доверительный интервал для среднего веса - [3.95,5.25] г.

$H_{1}$ : средний вес пудры в упаковке превышает норму $\Rightarrow p=0.0359$,
односторонний нижний $95 \%$ доверительный предел для среднего веса $4.05$ г.


$Z = \frac{\bar{x} - \mu}{\sigma} = 1.8 $

<ul>
 <li>$H_{1} (\mu \neq \mu_{0}):$ $p-value = 2(1-\operatorname{pnorm}(1.8, 0,1)) = 0.0719$, p-value> $\alpha$ (0.05)</li>
 <li>$H_{1}(\mu \neq \mu_{0}):$ $$
P\left(|U|<u_{\frac{\alpha}{2}}\right)=P\left(\left|\frac{\bar{x}-m}{\sigma / \sqrt{n}}\right|<u_{\frac{\alpha}{2}}\right)=P\left(\bar{x}-u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}<m<\bar{x}+u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\right)=1-\alpha
$$</li>
 <li>$H_{1}(\mu>\mu_{0}):$ $p-value = 1-\operatorname{pnorm}(1.8, 0,1) = 1 - 0.9641 = 0.0359$</li>
 <li>$H_{1}(\mu>\mu_{0}): Z_{critical} = 1.96, \alpha = 0.05$</li>
 </ul>

### Пример в *R-language*

In [21]:
install.packages('BSDA')

Installing package into ‘/home/darya/R/x86_64-pc-linux-gnu-library/4.1’
(as ‘lib’ is unspecified)

also installing the dependencies ‘proxy’, ‘e1071’




In [22]:
library(BSDA)

Loading required package: lattice


Attaching package: ‘BSDA’


The following object is masked from ‘package:datasets’:

    Orange




In [36]:
install.packages('asbio')
library('asbio')

Installing package into ‘/home/darya/R/x86_64-pc-linux-gnu-library/4.1’
(as ‘lib’ is unspecified)

also installing the dependencies ‘fastmap’, ‘cachem’, ‘memoise’, ‘pixmap’, ‘plotrix’, ‘mvtnorm’, ‘deSolve’, ‘combinat’, ‘multcompView’, ‘gWidgets2’, ‘gWidgets2tcltk’


Loading required package: tcltk



In [39]:
install.packages('pwr')
library(pwr)

Installing package into ‘/home/darya/R/x86_64-pc-linux-gnu-library/4.1’
(as ‘lib’ is unspecified)



In [9]:
n <- 9

# calculate the z-statistic
z_stat <- (4.6 - 4) / (1 / sqrt(n))
z_stat

In [16]:
library(distributions3)
Z <- Normal(0, 1) 
1 - cdf(Z, 1.8) 

In [17]:
1 - cdf(Z, abs(1.8)) + cdf(Z, -abs(1.8))

In [51]:
x <- rnorm(10)
z.test(x,sigma.x=1, mu = 1,  alternative = "greater")


	One-sample z-Test

data:  x
z = -3.1495, p-value = 0.9992
alternative hypothesis: true mean is greater than 1
95 percent confidence interval:
 -0.5161155         NA
sample estimates:
  mean of x 
0.004032869 


https://www.rdocumentation.org/packages/BSDA/versions/1.2.1/topics/z.test

## *Критерий Стьюдента*

## *Критерий $\chi^2$*

# Мощность критерия

In [38]:
power.z.test(sigma=6,effect=5,power=.9,test="one.tail")

# ЗАДАНИЕ

In [None]:
В файле data_ex1.csv находятся выборки по 10 экзмпляров. Необходимо сравнить среднее между выборками s1_1 c s2_1; s1_2 c s2_2