# TTI109 - Estatística
# Exercícios de Revisão - P2 2023
# Prof. Vitor Alex

## Instruções para uso das funções de teste de hipótese

Nas 4 células ocultas abaixo estão os códigos das funções:

* `TH_media_z`: Função para teste de hipótese da média populacional $\mu$, com nível de significância $\alpha$, supondo desvio padrão populacional $\sigma$ conhecido (uso do valor-p).
    
* `TH_media_z_regiao`: Idem anterior, porém utilizando as regiões de rejeição como critério de decisão.

* `TH_media_t`: Função para teste de hipótese da média $\mu$, com nível de significância $\alpha$, supondo desvio padrão populacional $\sigma$ desconhecido.

* `TH_vardp_chi2`: Função para teste de hipótese da variância $\sigma^2$ ou do desvio padrão $\sigma$ populacionais, com nível de significância $\alpha$.

**IMPORTANTE:** Execute as células ocultas! Não é necessário visualizá-las para que as funçõe sestejam disponíveis para uso. Entertanto, caso deseje verificar os códigos, clique no triângulo preto que antedece o título "Instruções para uso das funções de teste de hipótese".

In [None]:
def TH_media_z(x_barra=None, n_amostras=None, mu=None,
               sigma=None, alpha=0.05, teste='esquerda', conclusao=True):
  '''Função para teste de hipótese da média populacional mu, com nível de
  significância alpha, supondo desvio padrão populacional sigma conhecido.
  ENTRADA:
  - x_barra: média amostral
  - n_amostras: número de amostras coletadas no experimento
  - mu: hipótese nula para a média populacional
  - sigma: desvio padrão populacional
  - alpha: nível de significância adotado no teste (valor default 0.05)
  - teste: string que identifica o tipo de teste a ser realizado: 'esquerda'
  para teste unilateral à esquerda, 'direita', para teste unilateral à direita
  e 'bilateral' para teste bilateral (valor default 'esquerda')
  - conclusao: flag para ativação do relatório de conclusão do teste de hipótese
  (valor default=True)
  SAíDA:
  - relatório de conclusão do teste de hipótese, caso cocnlusao=True
  - p_valor: valor p do teste de hipótese'''

  from scipy import stats as st

  # Criação da distribuição amostral das médias
  dist_amostras = st.norm(loc=mu, scale=sigma/n_amostras**0.5)
  # loc: média da distribuição normal
  # scale: desvio padrão da distribuição normal

  # Cálculo do p-valor, de acordo com o tipo de teste
  if teste == 'esquerda':
    p_valor = dist_amostras.cdf(x_barra)
    # cdf: cumulative distribution function (função de distribuição acumulada)
    # ou seja, probabilidade de um valor menor ou igual a x_barra
    tipo = 'unilateral à esquerda'
  elif teste == 'direita':
    p_valor = dist_amostras.sf(x_barra)
    # sf: survival function (função de sobrevivência)
    # ou seja, probabilidade de um valor maior ou igual a x_barra
    tipo = 'unilateral à direita'
  elif teste == 'bilateral':
    # p_valor =  dist_amostras.cdf(x_barra) + dist_amostras.sf(x_barra)
    p_valor =  2*abs(dist_amostras.sf(x_barra))
    # 2*(dist_amostras.cdf(x_barra)) = dist_amostras.cdf(x_barra) + dist_amostras.sf(x_barra)
    # ou seja, probabilidade de um valor menor ou igual a x_barra + probabilidade de um valor maior ou igual a x_barra
    tipo = 'bilateral'

  # Relatório de conclusão do teste de hipótese
  if conclusao:
    print('*** Teste de hipótese para a média populacional (desvio padrão conhecido) ***')
    print(f'Teste {tipo} com p-valor = {p_valor:.6f}')
    if p_valor <= alpha:
      print(f'Hipótese nula rejeitada ao nível de significância {alpha*100}%')
    else:
      print(f'Hipótese nula NÃO rejeitada ao nível de significância {alpha*100}%')
  return p_valor

In [None]:
def TH_media_z_regiao(x_barra=None, n_amostras=None, mu=None,
                      sigma=None, alpha=0.05, teste='esquerda', conclusao=True):
  '''Função para teste de hipótese da média populacional mu, com nível de
  significância alpha, supondo desvio padrão populacional sigma conhecido.
  ENTRADA:
  - x_barra: média amostral
  - n_amostras: número de amostras coletadas no experimento
  - mu: hipótese nula para a média populacional
  - sigma: desvio padrão populacional
  - alpha: nível de significância adotado no teste (valor default 0.05)
  - teste: string que identifica o tipo de teste a ser realizado: 'esquerda'
  para teste unilateral à esquerda, 'direita', para teste unilateral à direita
  e 'bilateral' para teste bilateral (valor default 'esquerda')
  - conclusao: flag para ativação do relatório de conclusão do teste de hipótese
  (valor default=True)
  SAíDA:
  - relatório de conclusão do teste de hipótese, caso cocnlusao=True
  - z0: valor z crítico do teste de hipótese (fronteira da região de rejeição)'''

  from scipy import stats as st

  # Criação da distribuição normal padrão
  dist_padrao = st.norm(loc=0, scale=1)

  # Cálculo da estatística de teste padronizada
  z = (x_barra-mu)/(sigma/n_amostras**0.5)

  # Hipótese nula inicialmente validada
  rejeicao = False

  # Cálculo do z crítico, de acordo com o tipo de teste
  if teste == 'esquerda':
    z0 = dist_padrao.ppf(alpha)
    # ppf: percent point function (função inversa da cdf)
    # ou seja, valor de z que acumula uma probabilidade alpha
    tipo = 'unilateral à esquerda'
    # Decisão sobre pertinência de z à região de rejeição
    if z <= z0:
      rejeicao = True
  elif teste == 'direita':
    z0 = dist_padrao.ppf(1-alpha)
    # 1 - alpha é a probabilidade acumulada na cauda direita da distribuição normal padrão
    # ppf: percent point function (função inversa da cdf)
    # ou seja, valor de z que acumula uma probabilidade 1-alpha
    tipo = 'unilateral à direita'
    # Decisão sobre pertinência de z à região de rejeição
    if z >= z0:
      rejeicao = True
  elif teste == 'bilateral':
    z0 = dist_padrao.ppf(alpha/2)
    tipo = 'bilateral'
    # Decisão sobre pertinência de z à região de rejeição
    if (z <= z0) or (z >= -z0):
      rejeicao = True

  # Relatório de conclusão do teste de hipótese
  if conclusao:
     print('*** Teste de hipótese para a média populacional (desvio padrão conhecido) ***')
     print(f'Teste {tipo} com z0 = {z0:.6f}')
     if rejeicao:
      print(f'Hipótese nula rejeitada ao nível de significância {alpha*100}%')
     else:
      print(f'Hipótese nula NÃO rejeitada ao nível de significância {alpha*100}%')
  return z0

In [None]:
def TH_media_t(x_barra=None, n_amostras=None, mu=None, s=None,
               alpha=0.05, teste='esquerda', conclusao=True):
  '''Função para teste de hipótese da média mu, com nível de significância
     alpha, supondo desvio padrão populacional sigma desconhecido.
     ENTRADA:
     - x_barra: média amostral
     - n_amostras: número de amostras coletadas no experimento
     - mu: hipótese nula para a média populacional
     - s: desvio padrão amostral
     - alpha: nível de significância adotado no teste (valor default 0.05)
     - teste: string que identifica o tipo de teste a ser realizado: 'esquerda'
     para teste unilateral à esquerda, 'direita', para teste unilateral à direita
     e 'bilateral' para teste bilateral (valor default 'esquerda')
     - conclusao: flag para ativação do relatório de conclusão do teste de hipótese
     (valor default=True)
     SAÍDA:
     - relatório de conclusão do teste de hipótese, caso cocnlusao=True
     - t0: valor crítico do teste de hipótese'''

  from scipy import stats as st

  # Criação da distribuição t
  dist_t = st.t(df=n_amostras-1)

  # Cálculo da estatística de teste padronizada
  t = (x_barra-mu)/(s/n_amostras**0.5)

  # Hipótese nula inicialmente validada
  rejeicao = False

  # Cálculo do t crítico (t0), de acordo com o tipo de teste
  if teste == 'esquerda':
    t0 = dist_t.ppf(alpha)
    tipo = 'unilateral à esquerda'
    # Decisão sobre pertinência de t à região de rejeição
    if t <= t0:
      rejeicao = True
  elif teste == 'direita':
    t0 = dist_t.ppf(1-alpha)
    tipo = 'unilateral à direita'
    # Decisão sobre pertinência de t à região de rejeição
    if t >= t0:
      rejeicao = True
  elif teste == 'bilateral':
    t0 = dist_t.ppf(alpha/2)
    tipo = 'bilateral'
    # Decisão sobre pertinência de t à região de rejeição
    if (t <= t0) or (t >= -t0):
      rejeicao = True

  # Relatório de conclusão do teste de hipótese
  if conclusao:
    print('*** Teste de hipótese para a média populacional (desvio padrão desconhecido) ***')
    print(f'Teste {tipo} com t0 = {t0:.5f}')
    if rejeicao:
      print(f'Hipótese nula rejeitada ao nível de significância {alpha*100}%')
    else:
      print(f'Hipótese nula NÃO rejeitada ao nível de significância {alpha*100}%')
  return t0

In [None]:
def TH_vardp_chi2(est_amostral=None, n_amostras=None, val_parametro=None,
                  parametro='sigma', alpha=0.05, teste='esquerda',
                  conclusao=True):
  '''Função para teste de hipótese da variância ou do desvio padrão populacional,
  com nível de significância alpha.
  ENTRADA:
  - est_amostral: variância ou desvio padrão amostral
  - n_amostras: número de amostras coletadas no experimento
  - val_parametro = valor a ser testado, seja variância ou desvio padrão
  - parametro = 'sigma2' para teste de variância e 'sigma' para teste de
  desvio padrão populacional
  - alpha: nível de significância adotado no teste (valor default 0.05)
  - teste: string que identifica o tipo de teste a ser realizado: 'esquerda'
  para teste unilateral à esquerda, 'direita', para teste unilateral à direita
  e 'bilateral' para teste bilateral (valor default 'esquerda')
  - conclusao: flag para ativação do relatório de conclusão do teste de hipótese
  (valor default=True)
  SAÍDA:
  - relatório de conclusão do teste de hipótese, caso cocnlusao=True
  - chi2: valor da estatística padronizada
  - X20: valor(es) crítico(s) do teste'''

  from scipy import stats as st

  # Criação da distribuição chi-quadrado
  dist_chi2 = st.chi2(df=n_amostras-1)

  # Cálculo da estatística de teste padronizada
  if parametro == 'sigma2':
    chi2 = (n_amostras-1)*est_amostral/val_parametro
    param = 'variância'
  elif parametro == 'sigma':
    chi2 = (n_amostras-1)*est_amostral**2/val_parametro**2
    param = 'desvio padrão'

  # Hipótese nula inicialmente validada
  rejeicao = False

  # Cálculo do chi2 crítico, de acordo com o tipo de teste
  if teste == 'esquerda':
    X20 = dist_chi2.ppf(alpha)
    tipo = 'unilateral à esquerda'
    # Decisão sobre pertinência de X20 à região de rejeição
    if chi2 <= X20:
      rejeicao = True
  elif teste == 'direita':
    X20 = dist_chi2.ppf(1-alpha)
    tipo = 'unilateral à direita'
    # Decisão sobre pertinência de X20 à região de rejeição
    if chi2 >= X20:
      rejeicao = True
  elif teste == 'bilateral':
    X2L = dist_chi2.ppf(alpha/2)
    X2R = dist_chi2.ppf(1-alpha/2)
    tipo = 'bilateral'
    X20 = (X2L, X2R)
    # Decisão sobre pertinência de X20 à região de rejeição
    if (chi2 <= X2L) or (chi2 >= X2R):
      rejeicao = True

  # Relatório de conclusão do teste de hipótese
  if conclusao:
    print(f'*** Teste de hipótese para {param} populacional ***')
    print(f'Teste {tipo} com:')
    print(f'Estatística de teste padronizada = {chi2:.4f}')
    if isinstance(X20, tuple):
      print(f'Valores chi-quadrado críticos X2L = {X20[0]:.4f} e X2R = {X20[1]:.4f}')
    else:
      print(f'Valor chi-quadrado crítico = {X20:.4f}')
    if rejeicao:
      print(f'Hipótese nula rejeitada ao nível de significância {alpha*100}%')
    else:
      print(f'Hipótese nula NÃO rejeitada ao nível de significância {alpha*100}%')
  return chi2, X20

## Importações dos módulos básicos

In [None]:
# Importação de módulos
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

**Exercício 01**

Os sistemas de escapamento de uma aeronave funcionam devido a um propelente sólido. A taxa de queima desse propelente é uma característica importante do produto. As especificações requerem que a taxa média de queima tem de ser 50 cm/s. Sabe-se, de estudos anteriores, que o desvio padrão da taxa de queima é de 2 cm/s.

Para testar o requisito de queima, um pesquisador coleta uma amostra aleatória de 25 propelentes, obtendo uma taxa média de queima de 51,3 cm/s.

Ao nível de significância de 5%, há evidências para afirmar que o requisito de queima está satisfeito? Assuma que a população é normalmente distribuída.

In [None]:
'''Construção do teste de hipótese:
H0: mu = 50 cm/s (afirmação)
Ha: mu != 50 cm/s
Tipo de teste: bilateral'''

'Construção do teste de hipótese:\nH0: mu = 50 cm/s (afirmação)\nHa: mu != 50 cm/s\nTipo de teste: bilateral'

In [None]:
# Uso da função adequada para o teste
valor_p = TH_media_z(x_barra=51.3, n_amostras=25, mu=50,
                     sigma=2, alpha=0.05, teste='bilateral', conclusao=True)

*** Teste de hipótese para a média populacional (desvio padrão conhecido) ***
Teste bilateral com p-valor = 0.001154
Hipótese nula rejeitada ao nível de significância 5.0%


In [None]:
z0 = TH_media_z_regiao(x_barra=51.3, n_amostras=25, mu=50,
                       sigma=2, alpha=0.05, teste='bilateral', conclusao=True)

*** Teste de hipótese para a média populacional (desvio padrão conhecido) ***
Teste bilateral com z0 = -1.959964
Hipótese nula rejeitada ao nível de significância 5.0%


In [None]:
'''Conclusão: Não há evidências suficientes ao nível de significância de 5% para
afirmar que o requisito de queima está satisfeito.'''

'Conclusão: Não há evidências suficientes ao nível de significância de 5% para\nafirmar que o requisito de queima está satisfeito.'

**Exercício 02**

Semear nuvens tem sido estudado durante muitas décadas como um procedimento de mudança do tempo. A precipitação pluviométrica, em acres-pés, proveniente de 20 nuvens que foram selecionadas aleatoriamente e semeadas com nitrato de prata são armazenadas na variável `pluvio`, definida a seguir.

In [None]:
pluvio = pd.Series([18.0, 30.7, 19.8, 27.1, 22.3, 18.8, 31.8, 23.4, 21.2, 27.9,
                    31.9, 27.1, 25.0, 24,7, 26.9, 21.8, 29.2, 34.8, 26.7, 31,6])

Ao nível de significância de 1%, é possível sustentar a afirmação de que a precipitação média das nuvens semeadas excede 25 acres-pés? Assuma que a população é normalmente distribuída.

In [None]:
'''Construção do teste de hipótese:
H0: pm <= 25 acrés-pés
Ha: pm > 25 acrés-pés (afirmação)
Tipo de teste: unilateral à direita'''

'Construção do teste de hipótese:\nH0: pm <= 25 acrés-pés\nHa: pm > 25 acrés-pés (afirmação)\nTipo de teste: unilateral à direita'

In [None]:
# Uso da função adequada para o teste
t0 = TH_media_t(x_barra=pluvio.mean(), n_amostras=len(pluvio), mu=25,
                s=pluvio.std(ddof=1), alpha=0.01, teste='direita',
                conclusao=True)

*** Teste de hipótese para a média populacional (desvio padrão desconhecido) ***
Teste unilateral à direita com t0 = 2.51765
Hipótese nula NÃO rejeitada ao nível de significância 1.0%


In [None]:
'''Conclusão: Não há evidências suficientes ao nível de significância de 1% para
concordar com afirmação de que a precipitação média das nuvens semeadas
excede 25 acres-pés.'''

'Conclusão: Não há evidências suficientes ao nível de significância de 1% para\nconcordar com afirmação de que a precipitação média das nuvens semeadas\nexcede 25 acres-pés.'

**Exercício 03**

Uma máquina de enchimento automático é usada para encher garrafas com detergente líquido. Se a variância do volume de enchimento for diferente de 0,01 (onças-fluidas)^2, existirá um proporção inaceitável de garrafas cujo enchimento não foi completo e cujo enchimento foi em demasia.

Uma amostra aleatória de 20 garrafas resulta em uma avariância amostral de volume de enchimento de 0,0153 (onças-fluidas)^2. Ao nível de significância de 5%, há evidências suficientes que sugiram um problema na linha de enchimento das garrafas? Assuma que a população é normalmente distribuída.

In [None]:
'''Construção do teste de hipótese:
H0: sigma^2 = 0.01
Ha: sigma^2 != 0.01 (afirmação)
Tipo de teste: bilateral'''

'Construção do teste de hipótese:\nH0: sigma^2 = 0.01 (afirmação)\nHa: sigma^2 != 0.01\nTipo de teste: bilateral'

In [None]:
# Uso da função adequada para o teste
X20 = TH_vardp_chi2(est_amostral=0.0153, n_amostras=20,val_parametro=0.01,
                    parametro='sigma2', alpha=0.05, teste='bilateral',
                    conclusao=True)

*** Teste de hipótese para variância populacional ***
Teste bilateral com:
Estatística de teste padronizada = 29.0700
Valores chi-quadrado críticos X2L = 8.9065 e X2R = 32.8523
Hipótese nula NÃO rejeitada ao nível de significância 5.0%


In [None]:
'''Conclusão: Não há evidências suficientes ao nível de significância de 5%
para afirmar que existe problema na linha de produção.'''

'Conclusão: Não há evidências suficientes ao nível de significância de 5%\npara afirmar que existe problema na linha de produção.'

**Exercício 04**

Para testar a vida útil de pneus de carros de passeio, uma empresa selecionou uma amostra de 16 unidades e determinou que o desvio padrão na vida útil foi de 3695,94 km. Ao nível de significância de 5%, é possível concluir que o desvio padrão da vida útil de um pneu é menor do que 4000 km?

In [None]:
'''Construção do teste de hipótese:
H0: sigma >= 4000 km
Ha: sigma < 4000 km (afirmação)
Tipo de teste: unilateral à esquerda'''

'Construção do teste de hipótese:\nH0: sigma >= 4000 km\nHa: sigma < 4000 km (afirmação)\nTipo de teste: unilateral à esquerda'

In [None]:
# Uso da função adequada para o teste
X20 = TH_vardp_chi2(est_amostral=3695.94, n_amostras=16, val_parametro=4000,
                    parametro='sigma', alpha=0.05, teste='esquerda',
                    conclusao=True)

*** Teste de hipótese para desvio padrão populacional ***
Teste unilateral à esquerda com:
Estatística de teste padronizada = 12.8062
Valor chi-quadrado crítico = 7.2609
Hipótese nula NÃO rejeitada ao nível de significância 5.0%


In [None]:
'''Conclusão: Há evidências suficientes ao nível de significância para rejeitar
a afirmação de que o desvio padrão da vida útil de um pneu é menor do
que 4000 km.'''

'Conclusão: Há evidências suficientes ao nível de significância para rejeitar\na afirmação de que o desvio padrão da vida útil de um pneu é menor do\nque 4000 km.'