# Testes de Hipóteses

Uma hipótese é uma declaração sobre um parâmetro(s) de uma população. Assim, o teste de hipóteses é uma metodologia estatística que nos ajuda a verificar se dados amostrais coletados trazem evidência que apoiem ou não tal hipótese formulada, sendo, portanto, um método de inferência estatística.\
Nesse contexto, como comentado, as hipóteses são formuladas consirando parâmetros, como por exemplo a média ($\mu$), variância ($\sigma^{2}$), ou proporção ($p$) [[1]](https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html).

A linha de elaboração de um teste de hipótese é a seguinte [[2]](https://www.youtube.com/watch?v=VPmDaFbOtsM):

1 - Elaborar a **hipótese nula ($H_0$)** e a **hipótese alternativa ($H_1$ ou $H_a$)**. É importante lembrar que a **hipótese nula** sempre apresenta uma **afirmação de igualdade** ($\le, =, \ge$), enquanto a **hipótese alternativa** apresenta os demais símbolos ($<, \neq, >$).

2 - Calcular o **valor observado** ($z_{obs}, t_{obs}, ...$) utilizando a fórmula corresponde ao caso que se está analisando.

3 - Calcular a **região crítica (RC)** de acordo com a **hipótese alternativa** e $\alpha$. Importante notar as variações de RC em função do sinal da hipótese alternativa, os quais caracterizam testes unilaterias ($< ou >$) ouo bilaterais ($\neq$):

![img](https://emgotas.files.wordpress.com/2016/11/testes-de-hipc3b3testes-figura-1.jpg?w=653)

- nível de significância: menor valor no qual é possível **rejeitar a hipótese nula**, i.e. probabilidade de observar os dados se a hipótese nula for verdadeira (lembrando que a probabilidade a seguir não é condicional, pois a hipótese é acerca de um parâmetro da população, e não uma variável aleatória): $\alpha$ = P(dados|$H_0$ é verdadeira)

4 - Obter o **valor crítico** do test ($z_c, t_c, ...$) de acordo com $\alpha$ e com **RC** utilizando a tabela de distribuição correspondente (e.g. Normal, Student-t).

5 - Comparar valor observado, região crítica e valor crítico:
- se valor observado $\in$ RC $\to$ rejeitar $H_0$ e aceitar $H_1$
- se valor observado $\notin$ RC $\to$ aceitar $H_0$ e rejeitar $H_1$

6 - Interpretar os resultados.

Aqui é importante denotar os tipos de erro existentes no teste

- Erro Tipo I: rejeitar $H_0$ quando é verdadeira
- Erro Tipo II: não rejeitar $H_0$ quando é falsa
- Potência ou Poder do Teste: probabilidade de rejeitar $H_0$ quando $H_1$ é verdadeira

Tratando como probabilidades, temos que:

$\alpha$ = P(erro tipo I) = P(rejeitar $H_0$|$H_0$ verdadeira)

$\beta$ = P(erro tipo II) = P(não rejeitar $H_0$|$H_0$ falsa)

$1-\beta$ = P(rejeitar $H_0$|$H_1$ verdadeira)

A figura a seguir demonstra os erros do teste graficamente:

![img](https://www.oreilly.com/library/view/mastering-python-for/9781784390150/graphics/B03450_02_22.jpg)

In [1]:
import scipy.stats as stats
import numpy as np
import math

# Exercícios

**Exercício 1**

Uma estação de televisão afirma que 60% dos telespectadores estavam ligados no seu programa especial da última segunda-feira. Um canal concorrente contestando tal afirmação decide coletar uma amostra com 200 famı́lias e perguntar se o programa escolhido pela famı́lia era o programa do canal concorrente. Na amostra foram registradas 104 respostas afirmativas. O que você conclui ao nı́vel de 5% de significância?

Hipóteses:\
$H_0 \to p=0.6$\
$H_1 \to p<0.6$ (teste unilateral à esquerda)

Lembrando que:
$P\left( \frac{\hat{p}-p}{\sqrt{\frac{p*(1-p)}{n}}} < \frac{p_{critico}-p}{\sqrt{\frac{p*(1-p)}{n}}} \right) = \alpha$

In [5]:
n = 200 # 200 famílias
p = 0.6 # afirmação da tv
p_hat = 104/200 # proporção amostral
alpha = 0.05 # nível de significânica

z_alpha = stats.norm.ppf(1-alpha) # estatística
p_critico = np.sqrt((p*(1-p))/n)*z_alpha + p # valor crítico

print('p_critico: ', round(p_critico,4), ' e p_hat: ', round(p_hat,4),'\n')
if (p_hat < p_critico): # analisar valor observado e crítico em função da RC
    print('Rejeitar H0 -> TV mentiu')
elif (p_hat >= p_critico):
    print('Aceitar H0 -> TV não mentiu')

p_critico:  0.657  e p_hat:  0.52 

Rejeitar H0 -> TV mentiu


**Exercício 2**

Numa indústria de autopeças, sabe-se que o nı́vel de dureza de um
produto feito a base de cerâmica tem variabilidade $\sigma^2$ = 0.49. Uma
amostra de 16 peças foram testadas e o resultado é apresentado
abaixo:

$$[18.1, 19.0, 18.8, 18.5, 18.1, 18.8, 18.1, 18.0,18.5, 19.8, 17.8, 19.1, 18.0, 19.2, 19.8, 19.2]$$

Com um nı́vel de significância de 10%, pede-se:\
a) pode-se afirmar que a média do nı́vel de dureza é superior a 18.4?\
b) testar a hipótese bicaudal de que a média é igual a 18.4.

(a) Hipótese:\
$H_0 \rightarrow \mu = 18.4$\
$H_1 \rightarrow \mu > 18.4$ (teste unilateral à direita)

In [7]:
mu = 18.4 # população
std = 0.49 # variância populacional conhecida
x = [18.1,19.0,18.8,18.5,18.1,18.8,18.1,18.0,18.5,19.8,17.8,19.1,18.0,19.2,19.8,19.2] # amostras
x_mean = np.mean(x) # média amostral
x_std = np.std(x) # std amostral
n = len(x) # tamanho da amostra
alpha = 0.10 # nível de significância

z_alpha = stats.norm.ppf(1 - alpha) # estatística
x_critico = z_alpha*(std/np.sqrt(n)) + mu # valor crítico

print('x_critico: ', round(x_critico,2), ' - a_mean: ', round(x_mean,2),'\n')
if (x_mean > x_critico): 
    print('Rejeita H0 -> média é maior que 18.4')
elif (x_mean <= x_critico): 
    print('Aceita H0 -> média é igual a 18.4')

x_critico:  18.56  - a_mean:  18.68 

Rejeita H0 -> média é maior que 18.4


(b) Hipóteses:\
$H_0 \rightarrow \mu = 18.4$\
$H_1 \rightarrow \mu \neq 18.4$ (teste bilateral)

In [8]:
z_alpha = stats.norm.ppf(1-(alpha*0.5)) # estatística
x1_critico = -z_alpha*(std/np.sqrt(n)) + mu # valor crítico à esquerda
x2_critico = z_alpha*(std/np.sqrt(n)) + mu #  valor crítico à direita

print('x1_critico: ', round(x1_critico,2), ' - x2_critico: ', round(x2_critico,2),
      ' - x_mean: ', round(x_mean,2),'\n')
if (x_mean < x1_critico) or (x_mean > x2_critico):
    print('Rejeita H0 -> média é diferente de 18.4')
else:
    print('Aceita H0 -> média é igual a 18.4')

x1_critico:  18.2  - x2_critico:  18.6  - x_mean:  18.68 

Rejeita H0 -> média é diferente de 18.4


**Exercício 3**

Em fevereiro de 2016, o custo médio para um voo doméstico com passagens de ida e volta com desconto foi de R$ 290,00. Uma amostra aleatória dos preços de 15 passagens de ida e volta com desconto durante o mês de março forneceu os seguintes valores:

$$[310, 260, 265, 255, 300, 310, 230, 250, 265, 280, 290, 240, 285, 250, 260]$$

Usando $\alpha$ = 5% de significância, pode-se dizer que o preço médio da passagem de ida e volta, com desconto, diminui em março, em relação a fevereiro?

- Hipótese:\
$H_0 \rightarrow \mu=290$\
$H_1 \rightarrow \mu<290$ (teste unilateral à esquerda)

In [9]:
x = [310,260,265,255,300,310,230,250,265,280,290,240,285,250,260] # amostra
x_mean = np.mean(x) # média amostral
x_std = np.std(x) # std amostral
n = len(x) # tamanho da amostra
mu = 290 # média populacional
alpha = 0.05 # nível de significância

t_alpha = stats.t.ppf(1-alpha, df=n-1) # estatística
x_critico = t_alpha*(a_std/np.sqrt(n)) + mu # valor crítico

print('x_critico: ', round(x_critico,2), ' - a_mean: ', round(x_mean,2),'\n')
if (x_mean < x_critico): 
    print('Rejeita H0 -> média é menor que R$ 290')
else:
    print('Aceita H0 -> média é igual a R$ 290')

x_critico:  290.28  - a_mean:  270.0 

Rejeita H0 -> média é menor que R$ 290


**Exercício 4**

Um fabricante de creme dental alega que no máximo 3% dos seus produtos apresentam menos de 100 gramas por embalagem. Uma amostra aleatória com 300 produtos revelou que 14 possuı́am menos de 100 gramas. Assumindo o nı́vel de significância de 1% é possı́vel dizer que o fabricante está mentindo?

- Hipótese:\
$H_0 \rightarrow p\le0.03$\
$H_1 \rightarrow p>0.03$ (teste unilateral à esquerda)

In [10]:
n = 300 # tamanho da amostra
p = 0.03 # proporção afirmada pelo fabricante
p_hat = 14/300 # proporção amostral
alpha = 0.01 # nível de significância

z_value = stats.norm.ppf(1-alpha) # estatística
p_critico = -z_value*((p*(1-p))/np.sqrt(n)) + p # valor crítico

print('p_critico: ', round(p_critico,4), ' - p_hat: ', round(p_hat,4),'\n')
if (p_hat > p_critico): 
    print('Rejeita H0 -> mais que 3% dos produtos têm menos de 100 gramas')
else:
    print('Aceita H0 -> no máximo 3% dos produtos têm menos de 100 gramas')

p_critico:  0.0261  - p_hat:  0.0467 

Rejeita H0 -> mais que 3% dos produtos têm menos de 100 gramas


**Exercício 5**

Seja X uma v.a. correspondente ao peso do animal. Sabe-se que X~N(μ,σ²) com μ=30g e σ²=40. A média do peso pode variar se as condições de manejo não são adequadas. Para verificar se as condições estão adequadas, obteve-se uma amostra (n=25), cujos valores foram:

$$[30.26, 39.62, 21.29, 31.35, 26.12, 29.83, 26.31, 39.97, 28.01, 37.54, 25.28, 33.51, 39.57, 41.42,
 23.69, 40.53, 25.88, 23.11, 34.38, 35.15, 40.16, 29.51, 26.09, 24.96, 26.47]$$

- Hipótese:\
$H_0 \rightarrow \mu=30$\
$H_1 \rightarrow \mu\neq30$ (teste bilateral)
 
onde $\alpha$=0.05

In [11]:
x = [30.26, 39.62, 21.29, 31.35, 26.12, 29.83, 26.31, 39.97, 28.01, 37.54, 25.28, 33.51, 39.57, 41.42,
 23.69, 40.53, 25.88, 23.11, 34.38, 35.15, 40.16, 29.51, 26.09, 24.96, 26.47] # amostra
x_mean = np.mean(x) # média amostral
n = len(x) # tamanho da amostra
mu = 30 # média populacional
sigma = 40 # std populacional
alpha = 0.05 # nível de significância

z_value = stats.norm.ppf(1-(alpha*0.5)) # estatística
x1_critico = -z_value*(sigma/np.sqrt(n)) + mu # valor crítico
x2_critico = z_value*(sigma/np.sqrt(n)) + mu # valor crítico

print('x1_critico: ', round(x1_critico,2), ' - x2_critico: ', round(x2_critico,2),
      ' - x_mean: ', round(x_mean,2),'\n')
if (x_mean < x1_critico) or (x_mean > x2_critico): 
    print('Rejeita H0 -> média é diferente de 30')
else:
    print('Aceita H0 -> média é igual a 30')

x1_critico:  14.32  - x2_critico:  45.68  - x_mean:  31.2 

Aceita H0 -> média é igual a 30


**Exercício 6**

Uma máqina para colocar vacinas nos frascos enche-os com com volume X, X~N(500ml,σ²). Cada dia toma-se uma amostra de 16 frascos para avaliar se a máquina esta regulada. Em um dia obteve-se a amostra:

$$[509.42, 476.79, 507.27, 458.10, 473.30, 501.41, 515.07, 518.07,
463.76, 493.95, 521.62, 503.41, 480.71, 495.32, 481.55, 472.32]$$

a) Fazer um teste de hipóteses para testar se a média difere ou não de 500ml,
com (α=0,01).\
b) Fazer um teste de hipóteses para testar se a variância difere ou não de 400ml²
(α=0,10).

(a) Hipótese:\
$H_0 \rightarrow \mu=500$\
$H_1 \rightarrow \mu\neq500$ (teste bilateral)

In [12]:
x = [509.42, 476.79, 507.27, 458.10, 473.30, 501.41, 515.07, 518.07,
463.76, 493.95, 521.62, 503.41, 480.71, 495.32, 481.55, 472.32] # amostra
x_mean = np.mean(x) # média amostral
x_std = np.std(x) # std amostral
n = len(a) # tamanho da amostra
mu = 500 # média populacional
alpha = 0.01 # nível de significância

t_value = stats.t.ppf(1-(alpha*0.5), df=n-1) # estatística
x1_critico = -t_value*(a_std/np.sqrt(n)) + mu # valor crítico
x2_critico = t_value*(a_std/np.sqrt(n)) + mu # valor crítico

print('x1_critico: ', round(x1_critico,2), ' - x2_critico: ', round(x2_critico,2),
      ' - x_mean: ', round(x_mean,2),'\n')
if (x_mean < x1_critico) or (x_mean > x2_critico): 
    print('Rejeita H0 -> média é diferente de 500ml')
else:
    print('Aceita H0 - média é igual a 500ml')

x1_critico:  499.54  - x2_critico:  500.46  - x_mean:  492.0 

Rejeita H0 -> média é diferente de 500ml


(b) Hipótese:\
$H_0 \rightarrow \sigma²=400ml²$\
$H_1 \rightarrow \sigma²\neq400ml²$ (teste bilateral)

Ref: [[1]](http://www.portalaction.com.br/inferencia/55-teste-para-variancia)

In [13]:
sigma = 400 # variância populacional
alpha = 0.10 # nível de significância

chi2_amostra = ((n-1)*(x_std**2))/sigma # estatística
chi2_critico1 = stats.chi2.ppf(alpha*0.5, df=n-1) # valor crítico
chi2_critico2= stats.chi2.ppf(1-(alpha*0.5), df=n-1) # valor crítico

print('chi2 value1:', round(chi2_critico1,2),'- chi2 value2: ', round(chi2_critico2,2),
      '- chi2 amostra: ', round(chi2_amostra,2),'\n')
if (chi2_amostra < chi2_critico1) or (chi2_amostra > chi2_critico1): 
    print('Rejeita H0 -> variância diferente de 400ml²')
else:
    print('Aceita H0 -> variância igual a 400ml²')

chi2 value1: 7.26 - chi2 value2:  25.0 - chi2 amostra:  14.09 

Rejeita H0 -> variância diferente de 400ml²


**Exercício 7**

A quantidade de de calorias X de um produto segue uma distribuição X~N(μ,σ²). O fabricante afirma que a quantidade de calorias é 30 cal. Um concorrente questiona e diz que é mais que 30. Toma-se uma amostra de tamanho 25 e os valores observados foram:

$$[36.25, 30.69, 32.68, 30.43, 31.24, 32.73, 30.06, 32.71, 30.44,
31.48, 28.56, 29.29, 31.28, 33.30, 32.32, 30.63, 31.13, 32.72,
30.63, 31.37, 35.46, 25.15, 30.55, 36.57, 29.87]$$

Fazer um teste de hipóteses para testar se o fabricante ou o concorrente tem razão
(α=0,10).

- Hipótese:\
$H_0 \rightarrow \mu=30$\
$H_1 \rightarrow \mu\neq30$ (teste bilateral)

In [11]:
x = [36.25,30.69,32.68,30.43,31.24,32.73,30.06,32.71,30.44,31.48,
     28.56,29.29,31.28,33.30,32.32,30.63,31.13,32.72,30.63,31.37,35.46,25.15,30.55,36.57,29.87] # amostras
n = len(x) # tamanho da amostra
x_mean = np.mean(x) # média amostral
x_std = np.std(x) # std amostral
mu = 30 # média população
alpha = 0.10 # nível de significância

t_value = stats.t.ppf(1-(alpha*0.5), df=n-1) # estatística
x1_critico = -t_value*(a_std/np.sqrt(n)) + mu # valor crítico
x2_critico = t_value*(a_std/np.sqrt(n)) + mu # valor crítico

if (x_mean < x1_critico) or (x_mean > x2_critico): 
    print('Rejeita H0 -> média diferente de 30 cal')
else:
    print('Aceita H0 -> média é igual a 30 cal')

Rejeita H0 -> média diferente de 30 cal


**Exercício 8**\
Em um experimento de adubação de pastagens foram comparadas dois tipos de adubação (química e orgânica). Seja X a altura da planta com $X_q$ é N($\mu_q,\sigma²)$ e $X_o$ é N($\mu_q,\sigma²)$. Observaram-se 12 parcelas de $X_q$ e 10 parcelas de $X_o$. Os resultados são apresentados a seguir:

Xq = [58.0, 67.1, 56.4, 63.5, 65.9, 60.0, 62.6, 59.6, 70.0, 67.9, 69.9, 74.1]\
Xo = [74.9, 82.7, 71.8, 70.0, 71.8, 78.0, 69.6, 75.8, 62.8, 72.4]

a) Fazer um teste de hipóteses para testar a hipótese de homocedasticidade
(α=0,05).\
b) Fazer um teste de hipóteses para testar as hipótesesda médias serem iguais ou
não - $H_0$: $\mu_q=\mu_o$ vs $H_1$: $\mu_q \ne \mu_o$ ($\alpha$=0,05).



(a) Hipótese:\
$H_0 \rightarrow \sigma_{q}^²=\sigma_{o}²$\
$H_1 \rightarrow \sigma_{q}^²\neq\sigma_{o}²$ (teste bilateral)

Ref: [[2]](http://www.portalaction.com.br/inferencia/56-teste-para-comparacao-de-duas-variancias-teste-f)

In [16]:
x1 = [58.0, 67.1, 56.4, 63.5, 65.9, 60.0, 62.6, 59.6, 70.0, 67.9, 69.9, 74.1] # amostra 1
n1 = len(x1) # tamanho da amostra 1
x1_var = np.var(x1) # variância da amostra 1
x2 = [74.9, 82.7, 71.8, 70.0, 71.8, 78.0, 69.6, 75.8, 62.8, 72.4] # amostra 2
n2 = len(x2) # tamanho da amostra 2
x2_var = np.var(x2) # variância da amostra 2
alpha = 0.05 # nível de significância

F_amostras = x1_var/x2_var #  estatística
chi2_critico1 = stats.f.ppf(alpha*0.5, dfn=n1, dfd=n2) # valor crítico
chi2_critico2 = stats.f.ppf(1-(alpha*0.5), dfn=n1, dfd=n2) # valor crítico

if (F_amostras < chi2_critico1) or (F_amostras > chi2_critico2):
    print('Rejeita H0 -> variâncias diferentes')
else:
    print('Aecita H0 -> homocedasticidade')

Aecita H0 -> homocedasticidade


(b) Hipótese:\
$H_0 \rightarrow \mu_{q}=\mu_{o}$\
$H_1 \rightarrow \mu_{q}\neq\mu_{o}$ (teste bilateral)

Ref: [[3]](http://www.portalaction.com.br/inferencia/571-comparacao-de-medias-variancias-iguais)

In [17]:
x1_mean = np.mean(x1) # média da amostra 1
x1_std = np.std(x1) # std da amostra 1
x2_mean = np.mean(x2) # média da amostra 2
x2_std = np.mean(x2) # std da amostra 2
alpha = 0.05 # nível de significância

sp = np.sqrt(((n1-1)*x1_var + (n2-1)*x2_var)/(n1+n2-2)) # std agrupado (pooled)
t_amostras = (x2_mean - x1_mean)/sp*np.sqrt((1/n1) + (1/n2)) # estatística
t_value = stats.t.ppf(1-(alpha*0.5), df=(n1+n2)-2) # valor crítico

if (t_amostras < -t_value) or (t_amostras > t_value):
    print('Rejeita H0 -> médias são diferentes')
else:
    print('Aceita H0 -> médias são iguais')

Aceita H0 -> médias são iguais


In [19]:
# verificação com teste-t do scipy - H0: médias iguais
print('p_value:', round(stats.ttest_ind(x1, x2)[1],3), '< 0.05 --> aceita H0 onde amostras tem médias iguais')

p_value: 0.002 < 0.05 --> aceita H0 onde amostras tem médias iguais


**Exercício 9**

Avalia-se o diâmetro das patas dianteiras de 25 animais (pata com o procedimento cirurgico - CPC, e pata sem o procedimento cirurgico - SPC). Se X é o diâmetro da pata, com $X_{cpc}$ é N($\mu_{spc},\sigma^2)$ e $X_{cpc}$ é N($\mu_{spc},\sigma^2)$. Os resultados são apresentados a seguir:

SPC = [14.8, 15.1, 14.7, 14.7, 15.1, 16.2, 14.5, 14.5, 14.1, 14.1, 14.1, 15.1, 15.1, 15.5, 14.7, 14.8, 
        14.4, 14.6, 15.2, 14.8, 14.8, 15.0, 15.8, 14.7, 14.1, 15.8]
CPC = [14.4, 14.9, 15.3, 14.7, 14.5, 14.8, 14.9, 15.4, 15.4, 15.3, 15.4, 14.9, 14.8, 15.1, 15.6, 15.0,
        15.7, 14.4, 14.9, 14.9, 15.2, 15.7, 15.0, 15.0, 15.3, 15.4]
        
Fazer um teste de hipóteses para testar as hipóteses:

$H_0 \rightarrow \mu_{spc}=\mu_{cpc}$\
$H_1 \rightarrow \mu_{spc}<\mu_{cpc}$ (teste unilateral)

Onde $\alpha$=0,05

Ref: [[4]](http://www.portalaction.com.br/inferencia/58-teste-t-pareado)

In [21]:
x1 = [14.8, 15.1, 14.7, 14.7, 15.1, 16.2, 14.5, 14.5, 14.1, 14.1, 14.1, 15.1, 15.1, 15.5, 14.7, 14.8, 
     14.4, 14.6, 15.2, 14.8, 14.8, 15.0, 15.8, 14.7, 14.1, 15.8] # SPC
x1_mean = np.mean(x1) # média amostra SPC
x1_std = np.std(x1) # std amostra SPC
n = len(x1) # tamanho da amostra -> igual para ambos -> dados pareados
x2 =  [14.4, 14.9, 15.3, 14.7, 14.5, 14.8, 14.9, 15.4, 15.4, 15.3, 15.4, 14.9, 14.8, 15.1, 15.6, 15.0,
        15.7, 14.4, 14.9, 14.9, 15.2, 15.7, 15.0, 15.0, 15.3, 15.4] # CPC
x2_mean = np.mean(x2) # média amostra CPC
x2_std = np.mean(x2) # std amostra CPC
alpha = 0.05 # nível de significância

delta_sq = []
delta = []
for i in range(n):
    delta.append(x1[i] -  x2[i])
    delta_sq.append((x1[i] - x2[i])**2)
delta_mean_sq = (np.mean(delta))**2 # média das diferenças internas dos pares
delta_sq_sum = sum(delta_sq)
s_D = np.sqrt((delta_sq_sum - n*delta_mean_sq)/(n-1)) # desvio padrão das diferenças internas dos pares

t_amostras = (np.mean(delta)*np.sqrt(n))/(s_D) # estatística
t_value = stats.t.ppf(1-alpha, df=n-1) # valor crítico

if (t_amostras < -t_value):
    print('Rejeita H0 -> médias são diferentes: SPC < CPC')
else:
    print('Aceita H0 -> médias são iguais')

Aceita H0 -> médias são iguais


In [22]:
# verificação com teste-t do scipy - H0: médias iguais
print('p_value:',round(stats.ttest_rel(x1,x2)[1],3),' > 0.05: não rejeita H0')

p_value: 0.146  > 0.05: não rejeita H0


**Exercício 10**

Um produtor afirma que 60% dos peixes deuma represa pesam mais que 1 kg. O comprador, para testar a hipótese do vendedor, tomou uma amostra de 200 peixes, dos quais 104 pesaram mais de 1 kg. Fazer um teste de hipóteses para testar as hipóteses: 

$H_0 \rightarrow p=0.60$\
$H_1 \rightarrow p<0.60$ (teste unilateral)

Onde $\alpha=0.10$

In [23]:
p = 0.6 # proporção afirmada
n = 200 # tamanho da amostra
p_hat = 104/n # proporção amostral
alpha = 0.10 # nível de significância

z_value = stats.norm.ppf(1-alpha) # estatística
p_critico = -z_value*((p*(1-p))/np.sqrt(n)) + p # valor crítico

print('p_hat:', round(p_hat,3), '- p_critico:', round(p_critico,3),'\n')
if (p_hat < p_critico): 
    print('Rejeita H0 -> p < 60%')
else:
    print('Aceita H0 -> p > 60%')

p_hat: 0.52 - p_critico: 0.578 

Rejeita H0 -> p < 60%


**Exercício 11**

Para testar se a proporção de novilhas de uma fazenda F1 é a mesma que na fazenda F2, o agricultor tomou uma amostra de tamanho 100 na F1 - obteve 25 novilhas, e uma amostra de tamanho 120 na F2 – obteve 45 novilhas. Testar as hipóteses:

$H_0 \rightarrow p1=p2$\
$H_1 \rightarrow p1\neq p2$ (teste bilateral)

Onde $\alpha=0,05$

Ref: [[5]](http://www.portalaction.com.br/inferencia/59-teste-para-comparacao-de-duas-proporcoes)

In [18]:
n1 = 100 # tamanho da amostra 1
phat_1 = 25/n1 # proporção da amostra 1
n2 = 120 # tamanho da amostra 2
phat_2 = 45/n2 # proporção da amostra 2
alpha = 0.05 # nível de significância

z_alpha = stats.norm.ppf(1-(alpha*0.5)) # estatística
p_hat = (n1*phat_1 + n2*phat_2)/(n1+n2) 
z_amostras = (phat_1 - phat_2)/(np.sqrt(((p_hat*(1-p_hat))/n1)+((p_hat*(1-p_hat))/n2))) # valor crítico

if (z_amostras < -z_alpha) or (z_amostras > z_alpha):
    print('Rejeita H0 -> p1 é diferente de p2')
else:
    print('Aceita H0 -> p1 é igual a p2')

Rejeita H0 -> p1 é diferente de p2


**Exercício 12**

Para decidirmos se os habitantes de uma ilha são descendentes da civilização A ou B, iremos proceder do seguinte modo:\
(i) selecionamos uma amostra de 100 moradores adultos da ilha, e determinamos a altura média deles;\
(ii) se essa altura média for superior a 176, diremos que são descendentes de B; caso contrário, são descendentes de A.

Os parâmetros das alturas das duas civilizações são:\
A: μ = 175 e σ = 10; B: μ = 177 e σ = 10.

Defina: \
Erro do tipo I – dizer que os habitantes da ilha são descendentes de B quando, na realidade, são de A.\
Erro do tipo II – dizer que são de A quando são de B.

$H_0 \rightarrow \mu>176 \rightarrow$ pertence a B\
$H_1 \rightarrow \mu\neq176 \rightarrow$ pertence a A

In [25]:
# erro tipo I -> rejeitar H0 quando H0 é verdadeira
x_critico = 176
mu_a = 175
sigma_a = 10
n = 100

z_alpha = (x_critico-mu_a)/(sigma_a/np.sqrt(n))

print('probabilidade de erro tipo I:', round(1-stats.norm.cdf(z_alpha),3))

probabilidade de erro tipo I: 0.159


In [26]:
# erro tipo II -> aceitar H0 quando H0 é falsa
z_alpha = -(x_critico-mu_a)/(sigma_a/np.sqrt(n))

print('probabilidade de erro tipo II:', round(stats.norm.cdf(z_alpha),3))

probabilidade de erro tipo II: 0.159


**Exercício 13**

A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostra de nove indústrias e medido o número de horas/homens perdidos por acidentes, que foi de 50 horas. Você
diria, no nı́vel de 5%, que há evidência de melhoria?

- Hipótese:\
$H_0 \rightarrow \mu_{antes}=\mu_{depois}$\
$H_1 \rightarrow \mu_{antes}<\mu_{depois}$ (teste unilateral)

Onde $\alpha$=0.05

In [31]:
n = 9 # tamanho da amostra
mu = 60 # média da população
std = 20 # std da população
x_amostra = 50 # média amostral
alpha = 0.05 # nível de significância

z_alpha = stats.norm.ppf(alpha) # estatística
x_critico = z_alpha*(std/np.sqrt(n)) + mu # valor crítico

if (x_amostra < x_critico): 
    print('Rejeita H0 -> há evidência de melhora')
else:
    print('Aceita H0 -> não há evidência de melhora')

Aceita H0 -> não há evidência de melhora


**Exercício 14**

Uma companhia de cigarros anuncia que o ı́ndice médio de nicotina dos cigarros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza seis análises desse ı́ndice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o ı́ndice de nicotina se distribui normalmente, com variância igual a 4.86 mg2 . Pode-se aceitar, no nı́vel de 10%, a afirmação do fabricante?

- Hipótese:\
$H_0 \rightarrow \mu\ge23$ fabricante mente\
$H_1 \rightarrow \mu<23$ fabricante diz a verdade (teste unilateral)

In [24]:
alpha = 0.1 # nível de significância
x = [27, 24, 25, 26, 22] # amostra
x_mean = np.mean(x) # média amostral
n = len(x) # tamanho da amostra
mu = 23 # média populacional
std = np.sqrt(4.86) # std populaiconal

z_alpha = stats.norm.ppf(alpha) # estatística
x_critico = z_alpha*(std/np.sqrt(n)) + mu # valor crítico

if (x_mean < x_critico):
    print('Rejeita H0 -> fabricante diz a verdade')
else:
    print('Aceita H0 -> fabricante mente')

Aceita H0 -> fabricante mente


**Exercício 15**

O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusação, ele usou uma amostra de tamanho 50, onde 27% das peças eram defeituosas. Moste como o fabricante poderia refutar a acusação. Utilize um nı́vel de significância de 10%.

- Hipótese:\
$H_0 \rightarrow p=0.2 $ fabricante diz a verdade\
$H_1 \rightarrow p>0.2 $ fabricante mente (teste unilateral)

In [25]:
n = 50 # tamanho da amostra
alpha = 0.1 # nível de significância
p_hat = 0.27 # proporção amostral
p = 0.2 # proporção populacional

z_alpha = stats.norm.ppf(1-alpha) # estatística
p_critico = z_alpha*np.sqrt((p*(1-p))/(n)) + p # valor crítico

if (p_hat > p_critico):
    print('Rejeita H0 -> fabricante diz a verdade')
else:
    print('Aceita H0 -> fabricante mente')

Aceita H0 -> fabricante mente


**Exercício 16**

Um fabricante garante que 90% dos equipamentos que fornece a uma fábrica estão de acordo com as especificações exigidas. O exame de uma amostra de 200 peças desse equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, nos nı́veis de 5% e 1%.

- Hipótese:\
$H_0 \rightarrow p=0.9$ fabricante não mente -> tudo continua igual\
$H_1 \rightarrow p<0.9$ fabricante mente (teste unilateral)

Onde $\alpha$ = 0.05 e 0.01

In [26]:
# alpha = 0.05
alpha = 0.05
n = 200 # tamanho da amostra
p_hat = 1-25/n # proporção amostral
p = 0.9 # proporção populacional

z_alpha = stats.norm.ppf(alpha) # estatística
p_critico = z_alpha*np.sqrt((p*(1-p))/n) + p # valor crítico

if (p_hat < p_critico):
    print('Rejeita H0 -> p < 0.9')
else:
    print('Aceita H0 -> p > 0.9')

Aceita H0 -> p > 0.9


In [27]:
# alpha = 0.01
alpha = 0.01

z_alpha = stats.norm.ppf(alpha)
p_critico = z_alpha*np.sqrt((p*(1-p))/n) + p

if (p_hat < p_critico): 
    print('Rejeita H0 -> p < 0.9')
else:
    print('Aceita H0 -> p > 0.9')

Aceita H0 -> p > 0.9


**Exercício 17**

Suponha que queiramos testar H0 : μ = 50 contra H1 : μ > 50, onde μ é a média de uma normal N(μ, 900).\
Extraı́da uma amostra de n = 36 elementos da população, obtemos x̄ = 52. Calcule a probabilidade de significância $\alpha$ do teste.

- Hipótese:\
$H_0 \rightarrow \mu=50$\
$H_1 \rightarrow \mu>50$ (teste unilateral)

In [31]:
n = 36 # tamanho da amostra
mu = 50 # média populacional
std = np.sqrt(900) # std populacional

x_critico = 52
z_alpha = (x_critico-mu)/(std/np.sqrt(n)) # estatística
p_value = stats.norm.cdf(z_alpha) # valor crítico

print('probabilidade de significância alpha:',1-p_value)

probabilidade de significância alpha: 0.3445782583896758


**Exercício 18**

Os novos operários de uma empresa são treinados a operarem uma máquina, cujo tempo X (em horas) de aprendizado é anotado. Observou-se que X segue de perto a distribuição N(25, 100). Uma nova técnica de ensino, que deve melhorar o tempo de aprendizado, foi testada em 16 novos empregados, os quais apresentaram 20.5 horas como tempo médio de aprendizado. Usando o p-valor, você diria que a nova técnica é melhor que a anterior?

- Hipótese:\
$H_0 \rightarrow \mu=25$\
$H_1 \rightarrow \mu<25$ (teste unilateral)


In [33]:
n = 16 # tamanho da amostra
x_critico = 20.5
mu = 25 # média populacional
std = np.sqrt(100) # std populacional

z_alpha = (x_critico-mu)/(std/(np.sqrt(n))) # estatística
p_value = stats.norm.cdf(z_alpha)

print('p_value',p_value,
      'é inferior a 0.05 -> nova técnica é melhor que a antiga')

p_value 0.03593031911292579 é inferior a 0.05 -> nova técnica é melhor que a antiga


**Exercício 19**

Duas máquinas, A e B, são usadas para empacotar pó de café. A experiência passada garante que o desvio padrão para ambas é de 10g . Porém, suspeita-se que elas tem médias diferentes. Para verificar, sortearam-se duas amostras: uma com 25 pacotes da máquina A e outra com 16 pacotes da máquina B. As médias foram, respectivamente, x̄A = 502.74g e x̄B = 496.60g . Com esses números, e com nı́vel de 5%, qual seria a conclusão do teste H0: μA = μB ?

- Hipótese:\
$H_0 \rightarrow \mu_A=\mu_B$\
$H_1 \rightarrow \mu_{A}\neq\mu_B$ (teste bilateral)


In [35]:
n1 = 25 # tamanho da amostra 1
n2 = 16 # tamanho da amostra 2
a1_var = a2_var = 10**2 # std amostra
a1_mean = 502.74 # média da amostra 1
a2_mean = 496.6 # média da amostra 2
alpha = 0.05 # nível de significância

sp = np.sqrt(((n1-1)*a1_var + (n2-1)*a2_var)/(n1+n2-2)) # std agrupado (pooled)
t_value = stats.t.ppf(1-(alpha*0.5), df=(n1+n2)-2) # estatística
t_amostras = (a2_mean - a1_mean)/sp*np.sqrt((1/n1) + (1/n2)) # valor crítico

if (t_amostras < -t_value) or (t_amostras > t_value):
    print('Rejeita H0 -> médias são diferentes')
else:
    print('Aceita H0 -> médias são iguais')

Aceita H0 -> médias são iguais
