<a id='begin'></a>
# Intervalos de Confiança 


* [Média](#IC_media)
    * [Desvio padrão conhecido](#IC_media_Z)
    * [Desvio padrão desconhecido](#IC_media_t)
* [Proporção - Bernoulli](#IC_prop)
* [Taxa - Poisson](#IC_taxa)
* [Variância](#IC_var)
* [Razão entre duas variancias](#IC_2var)
* [Diferença entre duas médias](#IC_2med_caso1)
    * [Variâncias Conhecidas](#IC_2med_caso1)
    * [Variâncias desconhecidas porém iguais](#IC_2med_caso2)
    * [Variâncias desconhecidas e diferentes](#IC_2med_caso3)
* [Resumo](#Resumo)

<a id='IC_media'></a>
# Intervalo de Confiança para média

<a id='IC_media_Z'></a>
## Desvio padrão conhecido

Consideramos uma amostra aleatória simples $X_1, ... , X_n$ obtida de uma população com distribuição normal, com média $\mu$ e variância $\sigma^2$. Desta forma a distribuição amostral da média também é Normal e com média $\mu$ e variância $\sigma^2/n$ ou seja:

$$
    \bar X \sim N\left(\mu, \frac{\sigma^2}{n} \right)
$$

Assim temos que

$$
    Z = \frac{\bar X - \mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1)
$$

Se consideramos que a probabilidade da variável $Z$ toamr os valores entre $-Z_{\alpha /2}$ e $Z_{\alpha /2}$ é $1-\alpha$ chegamos ao intervalo:

$$
    \mathbb{P}[-Z_{\alpha /2}\le Z \le Z_{\alpha /2}] = 1 - \alpha
$$

substituindo a definição de Z,

$$
    \mathbb{P}\Biggl[-Z_{\alpha /2}\le \frac{\bar X - \mu}{\frac{\sigma}{\sqrt{n}}}\le Z_{\alpha /2}\Biggl] = 1 - \alpha
$$

o que implica que 

$$
    \mathbb{P}\Biggl[\bar X -Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}\le \mu \le \bar X + Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}\Biggl] = 1 - \alpha
$$

Com isso, o intervalo de confiança para a média com desvio padrão conhecido é dado por:

$$
    IC(\mu, 1-\alpha) = \Biggl(\bar X -Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}; \bar X + Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}\Biggl)
$$

### Interpretação
Podemos afirmar que, se pudermos repetir muitas vezes o experiemento e coletarmos os dados, aproximadamente em $100(1-\alpha)\% $ das vezes a média populacional estará no intervalo encontrado.

[Voltar](#begin)

### Exemplo
Determinar o intervalo de confinança para média amostra com nível $95\%$ para $\mu$ sabaneod que: $\bar x=19,9\quad n=36$ e $\sigma = 5,73$

In [42]:
import numpy as np
import matplotlib.pyplot as plt

In [50]:
from scipy.stats import norm

alpha = 0.95
n = 36
x_bar = 19.9
sigma = 5.73

Z_1, Z_2 = norm.interval(alpha)

LI= x_bar + Z_1*sigma/np.sqrt(n)
LS= x_bar + Z_2*sigma/np.sqrt(n)

print("IC(média, 1-alpha) = (", "%.2f"% LI, ";", "%.2f"%LS, ")")

IC(média, 1-alpha) = ( 18.03 ; 21.77 )


<a id='IC_media_t'></a>
## Desvio Padrão desconhecido

Na situação mais realista em que a variância $\sigma^2$ da população é desconhecida, utilizamos a variância amostral $s^2$ e assim temos que:

$$
    T = \frac{\bar X - \mu}{s/\sqrt{n}} \sim t_{n-1}
$$

Pela mesma manipulação anterior temos que:

$$
    IC(\mu, 1-\alpha) = \Biggl(\bar X -t_{\alpha /2} \frac{s}{\sqrt{n}}; \bar X + t_{\alpha /2} \frac{s}{\sqrt{n}}\Biggl)
$$

[Voltar](#begin)

### Exemplo
Dado a amostra abaixo, determine a média e seu intervalo de confiança

In [49]:
from scipy.stats import t

alpha = 0.95
x = [80, 118, 100, 90, 83, 117, 95, 84, 102, 80, 112, 78, 102, 121, 82, 77, 88, 73, 104, 88, 132, 91, 103,140,101]

x_bar = np.mean(x)
s = np.std(x,ddof=1)
n = len(x)

t_1, t_2 = t.interval(alpha, n-1)

LI= x_bar + t_1*s/np.sqrt(n)
LS= x_bar + t_2*s/np.sqrt(n)

print("Média amostral: ", x_bar)
print("IC(média, 1-alpha) = (", "%.2f"% LI, ";", "%.2f"%LS, ")")

Média amostral:  97.64
IC(média, 1-alpha) = ( 90.28 ; 105.00 )


<a id='IC_prop'></a>
# Intervalo de confiança para Proporção

Para um amostra grande podemos considerar a proporção amostral $\hat p$ como tendo aproximadamente distribuição normal com média:

$$
    \hat p \sim N \biggl( p, \frac{p(1-p)}{n} \biggl)
$$

Dessa forma o intervalo de confiança para proporção fica:

$$
    IC(\mu, 1-\alpha) = \Biggl(\hat p -Z_{\alpha /2} \sqrt{ \frac{\hat p (1- \hat p )}{n}}; \hat p +Z_{\alpha /2} \sqrt{ \frac{\hat p (1- \hat p )}{n}} \Biggl)
$$

Podemos melhorar essa a estimativa através da correção da continuidade para $p$ utilizando o valor:

$$
        \hat p_c =
            \begin{cases}
            \hat p + \frac{1}{2n} & \text{se $\hat p \lt 0.5$} \\
            \hat p - \frac{1}{2n} & \text{se $\hat p \gt 0.5$}
            \end{cases}
$$

[Voltar](#begin)

<a id='IC_taxa'></a>
# Intervalo de confiança para Taxa 

Consideramos uma amostra aleatória $ X_1, ..., X_n $ de uma popução com distribuição de Poisson com parâmetro $\lambda$, isto é

$$
    X_1, X_2, ... , X_n \sim \text{Poisson} (\lambda)
$$

Sabemos que $\hat \lambda = \displaystyle \sum_1^n \frac{X_i}{n}$ é um estimador de máxima verossimilhança para $\lambda$. Utilizando o teorema central do limite, temos que:

$$
    \hat \lambda = \sum_1^n \frac{X_i}{n} \sim N \biggl( \lambda, \frac{\lambda}{n} \biggl)
$$ 

o que implica que 

$$
    Z = \frac{\hat \lambda - \lambda}{\sqrt{\hat \lambda  / n}} \sim N(0,1)
$$

Dessa forma o intervalo de confiança para proporção fica:

$$
    IC(\lambda, 1-\alpha) = \Biggl(\hat \lambda -Z_{\alpha /2} \sqrt{ \frac{\hat \lambda}{n}}; \hat \lambda +Z_{\alpha /2} \sqrt{ \frac{\hat \lambda}{n}} \Biggl)
$$

[Voltar](#begin)

<a id='IC_var'></a>
# Intervalo de confiança para Variância

Consideramos uma amostra aleatória $ X_1, ..., X_n $ de uma popução com distribuição de Normal com média $\mu$ e variância $\sigma$. Um estimador para $\sigma^2$ é a variância amostral $s^2$. Sabemos que a quantidade pivotal


$$
    Q = \frac{(n-1)s^2}{\sigma^2} \sim \chi_{n-1}^2
$$

<sub>Para ver a demonstração dessa identidade acesse: [link](http://www.portalaction.com.br/probabilidades/63-distribuicao-qui-quadrado)<sub>

Seja $1-\alpha$ a probabildiade da variável $Q$ com $n-1$ graus de liberdade, tomar os valores entre $Q_{\alpha/2}$ e $Q_{1-\alpha/2}$, valores obtidos da distribuição qui-quadrado tais que 

$$
\mathbb{P}[Q\lt Q_{\alpha/2}] = \mathbb{P}[Q\gt Q_{1-\alpha/2}] = \alpha/2
$$

Pela simples manipulação, conforme exemplos anteriores, obtemos:

$$
    IC(\sigma^2, 1-\alpha) = \left( \frac{(n-1)s^2}{Q_{1-\alpha/2}}, \frac{(n-1)s²}{Q_{\alpha/2}} \right)
$$


[Voltar](#begin)

## Exemplo
Dada a amostra abaixo estime o desvio padrão da população e seu intervalo de confiança com grau de confiança igual a 95%:

In [69]:
from scipy.stats import chi2

x = [98, 97, 102, 100, 98, 101, 102, 105, 95, 102, 100]
alpha = 0.95

n = len(x)
s2 = np.var(x, ddof=1)
s = np.sqrt(s2)

Q1,Q2 = chi2.interval(alpha, df=n-1)

LI = (n-1)*s2/Q2
LS = (n-1)*s2/Q1

print("Variância amostral: ", "%.2f"%s2)
print("IC(variancia, 1-alpha) = (", "%.2f"% LI, ";", "%.2f"%LS, ")")

print("\n")

LI = np.sqrt(LI)
LS = np.sqrt(LS)
print("Desvio Padrão amostral: ", "%.2f"%s)
print("IC(variancia, 1-alpha) = (", "%.2f"% LI, ";", "%.2f"%LS, ")")


Variância amostral:  8.00
IC(variancia, 1-alpha) = ( 3.91 ; 24.64 )


Desvio Padrão amostral:  2.83
IC(variancia, 1-alpha) = ( 1.98 ; 4.96 )


<a id='IC_2var'></a>
# Intervalo de confiança para razão entre duas variancias

Para construir um intervalo de confiança para a razão entre duas variâncias de populações normais independentes,  considere uma amostra aleatória $X_1, X_2, ... X_{n1}$ da população 1, com ditribuição $N(\mu_1,\sigma_1^2)$, e uma amostra $Y_1, Y_2, ..., Y_{n2}$ da populção 2, com distribuição $N(\mu_2,\sigma_2^2)$. 

Ja sabemos que:

$$
    Q_i = \frac{(n_i-1)s_i^2}{\sigma_i^2} \sim \chi_{n_i-1}^2
$$

Definindo a variável F como:

$$
    F = \frac{\frac{Q_1}{n_1-1}}{\frac{Q_2}{n_2-1}} = \frac{\frac{s_1^2}{\sigma_1^2}}{\frac{s_2^2}{\sigma_2^2}} = \frac {s_1^2 \sigma_2^2}{s_2^2 \sigma_1^2} \sim F_{n_1-1;n_2-1}
$$

que é uma distribuição [F de Snedecor](http://www.portalaction.com.br/probabilidades/66-distribuicao-f-de-snedecor) com $n_1-1$ graus de liberdade do numerador e $n_2-1$ graus de liberdade no denominador.

Com isso podemos construir o intervalo de confiançan com nível $1-\alpha$ como:

$$
    \mathbb{P}(F_{\alpha/2}\lt F \lt F_{1-\alpha/2} ) = 1 - \alpha
$$

Substituindo a definiçao de F e após algumas manipulações chegamos em:

$$
    IC(\sigma_1^2/\sigma_2^2, 1-\alpha) = \left( \frac{1}{F_{(n_1-1, n_2-1, 1-\alpha/2)}}\frac{s_1^2}{s_2^2};\frac{1}{F_{(n_1-1,n_2-1, \alpha/2)}}\frac{s_1^2}{s_2^2} \right)
$$


[Voltar](#begin)


# Intervalo de confiança para diferença entre duas médias

<a id='IC_2med_caso1'></a>
## Variâncias Conhecidas
Considere uma amostra aleatória $X_1, X_2, ... X_{n1}$ da população 1, com ditribuição $N(\mu_1,\sigma_1^2)$, e uma amostra $Y_1, Y_2, ..., Y_{n2}$ da populção 2, com distribuição $N(\mu_2,\sigma_2^2)$. 

Sabemos que $\bar X \sim N\left(\mu_1, \frac{\sigma_1^2}{n_1}\right)$
e $\bar Y \sim N\left(\mu_2, \frac{\sigma_2^2}{n_2}\right)$. Daí, temos que:

$$
    \bar X - \bar Y \sim N\left( \mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2} \right)
$$

O que implíca que

$$
    Z = \frac{ (\bar X - \bar Y) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)
$$

Assim o intervalo de confiança para diferença entre duas médias com desvio padrão conhecido é

$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right)
$$



[Voltar](#begin)

<a id='IC_2med_caso2'></a>
## Variâncias desconhecidas porém iguais
Considerando as mesmas amostras aleatórias do caso anterior porém com variâncias desonhecidas porém iguais, isto é, $\sigma_1^2 = \sigma_2^2 = \sigma$

$$
    T = \frac{ (\bar X - \bar Y) - (\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t_{n_1+n_2-2}
$$

onde

$$
    s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 -2}}
$$

Dessa forma para um nível de confiança de $1-\alpha$ obtemos

$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm t_{(n_1+n_2-2, \alpha/2)}s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}\right)
$$

[Voltar](#begin)

<a id='IC_2med_caso3'></a>
## Variâncias desconhecidas e diferentes
Para o caso das variâncias desconhecidas e diferentes obtemos uma construção semelhante a anterior porém o número de graus de liberdade para a distribuição t-Student fica na forma:

$$
    \nu = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1} + \frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}
$$

e o Intevalo de confiança fica:

$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm t_{(\nu, \alpha/2)}\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}\right)
$$

[Voltar](#begin)

### Exemplo
Foram coletados dados de uma mesma variável de qualidade de dois métodos de produção diferentes. Para um nível de confiança de 95% qual o intervalo de confiança para a diferença entre as médias dos dois processos?


In [89]:
X = [0.9, 2.5, 9.2, 3.2, 3.7, 1.3, 1.2, 2.4, 3.6, 8.3]
Y = [5.3, 6.3, 5.5, 3.6, 4.1, 2.7, 2.0, 1.5, 5.1, 3.5]
alpha = 0.95

x_bar = np.mean(X)
n_1 = len(X)
s_1_2 = np.var(X, ddof=1)

y_bar = np.mean(Y)
n_2 = len(Y)
s_2_2 = np.var(Y, ddof=1)

delta = x_bar - y_bar

dof = (s_1_2/n_1 + s_2_2/n_2)**2 / ( ((s_1_2/n_1)**2)/(n_1-1) + ((s_2_2/n_2)**2)/(n_2 - 1) )
t1, t2 = t.interval(alpha, dof)

LI = delta + t1*sqrt(s_1_2/n_1 + s_2_2/n_2)
LS = delta + t2*sqrt(s_1_2/n_1 + s_2_2/n_2)

print("Diferença entre as médias amostrais: ", "%.3f"% delta)
print("IC(x_bar - y_bar, 1-alpha) = ", "%.3f"% LI, "%.3f"% LS, )

Diferença entre as médias amostrais:  -0.330
IC(x_bar - y_bar, 1-alpha) =  -2.561 1.901


<a id='Resumo'></a>
# Resumo

## Intervalo de confiança para média
   ### Desvio padrão conhecido
$$
    IC(\mu, 1-\alpha) = \Biggl(\bar X -Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}; \bar X + Z_{\alpha /2} \frac{\sigma}{\sqrt{n}}\Biggl)
$$

   ### Desvio padrão desconhecido
$$
    IC(\mu, 1-\alpha) = \Biggl(\bar X -t_{(n-1,\alpha /2)} \frac{s}{\sqrt{n}}; \bar X + t_{(n-1, \alpha /2)} \frac{s}{\sqrt{n}}\Biggl)
$$
   
## Intervalo de confiança para Proporção
$$
    IC(\mu, 1-\alpha) = \Biggl(\hat p -Z_{\alpha /2} \sqrt{ \frac{\hat p (1- \hat p )}{n}}; \hat p +Z_{\alpha /2} \sqrt{ \frac{\hat p (1- \hat p )}{n}} \Biggl)
$$
Onde, 
$$
        \hat p_c =
            \begin{cases}
            \hat p + \frac{1}{2n} & \text{se $\hat p \lt 0.5$} \\
            \hat p - \frac{1}{2n} & \text{se $\hat p \gt 0.5$}
            \end{cases}
$$

## Intervalo de confiança para Taxa
$$
    IC(\lambda, 1-\alpha) = \Biggl(\hat \lambda -Z_{\alpha /2} \sqrt{ \frac{\hat \lambda}{n}}; \hat \lambda +Z_{\alpha /2} \sqrt{ \frac{\hat \lambda}{n}} \Biggl)
$$

## Intervalo de confiança para Variância


$$
    IC(\sigma^2, 1-\alpha) = \left( \frac{(n-1)s^2}{Q_{(n-1, 1-\alpha/2)}}, \frac{(n-1)s²}{Q_{(n-1, \alpha/2)}} \right)
$$

## Intervalo de Confiança para razão entre duas variancias
$$
    IC(\sigma_1^2/\sigma_2^2, 1-\alpha) = \left( \frac{1}{F_{(n_1-1, n_2-1, 1-\alpha/2)}}\frac{s_1^2}{s_2^2};\frac{1}{F_{(n_1-1,n_2-1, \alpha/2)}}\frac{s_1^2}{s_2^2} \right)
$$

## Intervalo de confiança para diferença entre duas médias
### Desvio padrão conhecido
$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right)
$$

### Desvio padrão desconhecido e iguais

$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm t_{(n_1+n_2-2, \alpha/2)}s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}\right)
$$

onde

$$
    s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 -2}}
$$


### Desvio padrão desconhecido e diferente
$$
    IC(\mu_1-\mu_2, 1-\alpha) = \left( (\bar X - \bar Y) \pm t_{(\nu, \alpha/2)}\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}\right)
$$
onde, 
$$
    \nu = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1} + \frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}
$$

## Intervalo de Previsão para uma observação futura da média

$$
    \bar x - t_{\alpha/2, n-1} s \sqrt{1+\frac{1}{n}} \lt X_{n+1}\lt\bar x + t_{\alpha/2, n-1} s \sqrt{1+\frac{1}{n}}
$$


[Voltar](#begin)