<a href="https://colab.research.google.com/github/ismaelnobrega/projeto/blob/master/Teste_de_hipoteses_forestFires.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Teste de hipóteses

## Procedimento para realizar um teste de hipótese

1. Identifique o parâmetro de interesse no problema em análise.
2. Fixe qual a hipótese nula $H_0$ e alternativa $H_a$.
3. Use teoria estatı́stica e informações disponı́veis para decidir que estimador será usado para testar $H_0$.
4. Obtenha a distribuição do estimador proposto.
5. Determine $\alpha$.
6. Construa a região crı́tica para o teste de modo que $\alpha$ seja satisfeita.
7. Use os dados da amostra para determinar o valor do estimador, ou
seja, uma estimativa para o parâmetro.
8. Se o valor do estimador pertencer a região crı́tica, rejeite $H_0$. Caso contrário, reporte que não existe evidência para se rejeitar $H_0$.

### Exemplo

Um comprador de tijolos julga que a qualidade dos tijolos está
deteriorando. Sabe-se pela experiência passada que a média de
resistência ao esmagamento destes tijolos é de 400 libras com desvio
padrão de 20 libras. Uma amostra de 100 tijolos deu uma média de 395
libras. Teste a hipótese de que a qualidade média não se alterou contra
a alternativa de que se tenha deteriorado. (considere o nı́vel de
significância de 5%)

1. Parâmetro de interesse: $\mu$
2. $H_0: \mu = 400$; $H_a \neq 400$
3. Estimador: $\bar{X}$
4. $Z_0 = \frac{\bar{X} - \mu_0}{\frac{\sigma}{\sqrt{n}}}$ 
5. $\alpha = 0,05$
6. $z_c = 1,96$. Rejeitamos $H_0$ se $z_0 < -1.96$ ou $z_0 > 1.96$.
7. $z_0 = \frac{395 - 400}{\frac{20}{\sqrt{100}}} = -\frac{5}{2} = -2,5$
8. Rejeitamos $H_0$, isto é, a resistência não é mais de 400 libras.

In [0]:
import scipy.stats as st
import numpy as np

In [0]:
def calc_z0(xm, mi, sigma, n):
  return (xm - mi)/(sigma/np.sqrt(n))

In [0]:
def decision_normal(z0, alpha, unilateral=True, right=True):
  p = st.norm.cdf(z0)
  if unilateral:
    if right:
      reject = (p > (1.0 - alpha))
    else:
      reject = (p < alpha)
  else:
    reject = ((p < (alpha/2)) | (p > (1.0 - alpha/2)))

  return reject

In [0]:
mi = 400
sigma = 20
n = 100
xm = 395 
alpha = 0.05

z0 = calc_z0(xm, mi, sigma, n)

In [0]:
print('z0 = ', z0)
p_z0 = st.norm.cdf(z0)
print('p(z0) = ', p_z0)

reject = decision_normal(z0, alpha, unilateral=False)

if(reject):
  print('H_0 rejeitada')
else:
  print('H_0 não rejeitada')

z0 =  -2.5
p(z0) =  0.006209665325776132
H_0 rejeitada


### Exemplo

Um trecho de uma rodoviária, quando é utilizado o radar, são verificadas
em média 7 infrações diárias por excesso de velocidade. O chefe da
polı́cia acredita que este número pode ter aumentado. Para verificar isso,
o radar foi mantido por 10 dias consecutivos. Os resultados foram: 8, 9,
5, 7, 8, 12, 6, 9, 6, 10. Os dados trazem evidências do aumento das
infrações?

1. Parâmetro de interesse: $\mu$
2. $H_0: \mu \le 7$; $H_a > 7$
3. Estimador: $\bar{X} = 8$
4. $t_0 = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}$ 
5. $\alpha = 0,05$
6. $t_c = 1,83$. Rejeita $H_0$ se $t_0 > 1.83$.
7. $t_0 = \frac{8 - 7}{\frac{2,1}{\sqrt{10}}} = 1,5$
8. Não rejeitamos $H_0$, o que implica que o número de infrações não
teve um aumento significativo.

In [0]:
def calc_t0(xm, mi, s, n):
  return (xm - mi)/(s/np.sqrt(n))

In [0]:
def decision_tstudent(t0, alpha, df, unilateral=True, right=True):
  p = st.t.cdf(t0, df)
  if unilateral:
    if right:
      reject = (p > (1.0 - alpha))
    else:
      reject = (p < alpha)
  else:
    reject = ((p < (alpha/2)) | (p > (1.0 - alpha/2)))

  return reject

In [0]:
mi = 7
x = np.array([8, 9, 5, 7, 8, 12, 6, 9, 6, 10])
xm = np.mean(x)
s = np.std(x)
n = len(x)
df = n - 1
alpha = 0.05

t0 = calc_t0(xm, mi, s, n)

In [0]:
print('t0 = ', t0)
p_t0 = st.t.cdf(t0, df)
print('p(t0) = ', p_t0)

reject = decision_normal(t0, alpha, df)

if(reject):
  print('H_0 rejeitada')
else:
  print('H_0 não rejeitada')

t0 =  1.5811388300841895
p(t0) =  0.9258476463167203
H_0 não rejeitada


### Exercício

A vida média de uma amostra de 100 lâmpadas
fluorescentes produzidas por uma companhia foi
calculada em 1570 horas, com desvio padrão de
120 horas. Se $\mu$ é a vida média de todas as
lâmpadas produzidas pela companhia, teste a
hipótese $\mu = 1600$ horas, em face da hipótese
alternativa $\mu \neq 1600$ horas, adotando o nível de
significância 0,05 e 0,01 .

In [0]:
n = 100
xm = 1570
s = 120
mi = 1600

In [0]:
alpha = 0.05
# Como n >= 30 podemos usar a normal
sigma = s
z0 = calc_z0(xm, mi, sigma, n)
reject = decision_normal(z0, alpha, unilateral=False)
if(reject):
  print('H_0 rejeitada')
  print('A vida média das lâmpadas não é 1600h')
else:
  print('H_0 não rejeitada')
  print('Não há evidência que a vida média seja diferente de 1600h')

H_0 rejeitada
A vida média das lâmpadas não é 1600h


In [0]:
alpha = 0.01
reject = decision_normal(z0, alpha, unilateral=False)
if(reject):
  print('H_0 rejeitada')
  print('A vida média das lâmpadas não é 1600h')
else:
  print('H_0 não rejeitada')
  print('Não há evidência que a vida média seja diferente de 1600h')

H_0 não rejeitada
Não há evidência que a vida média seja diferente de 1600h


Em um estudo para avaliar um novo motor instalado
em automóveis, um grupo de pesquisa está buscando
evidências para concluir que o novo motor aumenta a
média de quilômetros por litro. Numa amostra de 25
carros com o motor antigo, a média de km/l foi de 12 e
desvio padrão de 0,5. O que se pode concluir a
respeito desse novo motor, sabendo que o fabricante
garante uma média de 13km/l e nível de significância
de 5\%?

In [0]:
n = 25
xm = 12
s = 0.5
mi = 13
alpha = 0.05
df = n-1

In [0]:
t0 = calc_t0(xm, mi, s, n)
p_t0 = st.t.cdf(t0, df)
interval = st.t.interval(alpha, df)
print(t0)
print(p_t0)

reject = decision_tstudent(t0, alpha, df, unilateral=True, right=False)
if(reject):
  print('H_0 rejeitada')
  print('Os carros antigos têm uma média de quilometragem por litro menor')
else:
  print('H_0 não rejeitada')
  print('Não há evidência que os carros antigos têm uma média de quilometragem por litro menor')

-10.0
2.457762763837646e-10
H_0 rejeitada
Os carros antigos têm uma média de quilometragem por litro menor
