<a href="https://colab.research.google.com/github/JosenildoJunior/StatPyDataScience/blob/main/Teste_de_hip%C3%B3tese_e_intervalo_de_confian%C3%A7a_para_m%C3%A9dias.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Teste de hipótese e intervalo de confiança para médias e proporções**

Vamos entender alguns tópicos importantes sobre testes de hipóteses e sua aplicação.

## **O que são Testes de Hipóteses e Intervalos de Confiança?**



- Um teste de hipóteses é um procedimento estatístico utilizado para tomar decisões sobre uma afirmação feita a respeito de um parâmetro de interesse em uma população.

- Enquanto isso, um intervalo de confiança é uma faixa de valores que provavelmente contém o verdadeiro valor de um parâmetro desconhecido.

## **Níveis de Significância e Região Crítica**

Ao realizar um teste de hipóteses, estabelecemos um nível de significância ($\alpha$), que representa a probabilidade de cometer um erro do Tipo I, ou seja, rejeitar a hipótese nula quando ela é verdadeira. A região crítica é a área da distribuição amostral na qual rejeitamos a hipótese nula se a estatística de teste cair dentro dela.

## **Testes de Hipóteses e Intervalos de Confiança para Médias (1 Amostra)**

Os testes de hipóteses e os intervalos de confiança para médias são amplamente utilizados para fazer inferências sobre a média populacional com base em uma amostra.

### Intervalo de confiança para médias quando o **desvio-padrão populacional é conhecido**

No caso em que tivermos uma situação onde o desvio padrão populacional é conhecido, a distribuição é bem próxima a uma normal e os dados foram coletados de forma aleatória, poderemos utilizar a distribuição z para criarmos um intervalo de confiança.

Mas antes precisamos estar com cientes de alguns topicos como por exemplo:

**Erro padrão**: Que nada mais é que a maior distancia entre a estimativa pontual e o valor que esta sendo estimado, para realizar esse calculo seguiremos a seguinte formula:

- $EP = σ / √n$

Onde:

σ é o desvio padrão populacional conhecido

n é o tamanho da amostra

E então podemos para obtermos o **intervalo de confiança**:

- $IC = x̄ ± z * EP$

Onde:

x̄ é a média amostral

z é o valor crítico da distribuição normal padrão para o nível de confiança desejado

EP é o erro padrão


**Exemplo**:

O diretor de admissões de uma faculdade deseja estimar a idade média de todos os estudantes matriculados. Em uma amostra aleatória de 20 estudantes, a média amostral é de 22,9 anos e a distribuição dos dados é normal. De estudos anteriores, o desvio padrão populacional conhecido é de 1,5 ano e a população é normalmente distribuída. Construa um intervalo de confiança de 90% para a idade média da população.

**Resposta**:

Aqui podemos observar que os dados estão normalmente distribuídos e conhecemos a média populacional. Podemos também notar que a amostra é aleatória, logo podemos utilizar o intervalo de confiança z.

Agora vamos calcular o erro padrão.

In [18]:
# Funções matématicas
from math import sqrt

# Calculando o erro padrão
erro_padrao = 1.5 / sqrt(20)

Como sabemos que a nossa distribuição é normal, vamos importar a seguinte biblioteca para nos auxiliar.

In [19]:
# Importando a função norm
from scipy.stats import norm

A função norm é utilizada para calcular o intervalo de confiança para uma distribuição normal. Agora, podemos partir para o cálculo propriamente dito.

In [20]:
# Calculando o intervalo de confiança
intervalo_confianca = norm.interval(confidence=0.95, loc=22.9, scale=erro_padrao)

# Exibindo o intervalo
print(f"Intervalo de confiança: {intervalo_confianca}")

Intervalo de confiança: (22.24260809456756, 23.557391905432436)


Logo, podemos afirmar com 95% de confiança que a média dos estudantes está entre 22,2 e 23,5 anos.



### Intervalo de confiança para médias quando o **desvio-padrão populacional é desconhecido**

Antes de tudo, vamos entender um pouco sobre a distribuição t de Student.

O teste t de Student é usado para testar se a média de uma única amostra difere significativamente da média de uma população ou de um valor de referência conhecido.

**Quando utilizar o Teste T de Student?**

-  O teste t é comumente utilizado em situações onde estamos interessados em comparar a média de uma amostra com uma média populacional conhecida ou para comparar as médias de duas amostras independentes.

-  Quando o tamanho da amostra é pequeno (geralmente menos de 30) e a distribuição das pontuações é aproximadamente normal.

O passo a passo para calcular o intervalo de confiança utilizando a distribuição t é bastante similar ao da distribuição z.

Primeiro, vamos calcular o **erro padrão**:

- $E = t_c * s / √n$

Onde:

E: Erro padrão da média

t_c: Valor crítico da distribuição t de Student com n-1 graus de liberdade e nível de confiança 1-α/2

s: Desvio padrão da amostra

n: Tamanho da amostra

Em seguida, podemos calcular o **intervalo de confiança**:

- $IC = X̄ ± t_c * s / √n$

Onde:

IC: Intervalo de confiança

X̄: Média da amostra

t_c: Valor crítico da distribuição t de Student com n-1 graus de liberdade e nível de confiança 1-α/2

s: Desvio padrão da amostra

n: Tamanho da amostra

Dito isso, vamos a um exemplo:

Você seleciona aleatoriamente 16 cafeterias e mede a temperatura do café vendido em cada uma delas. A temperatura média da amostra é de 162,0°F (Fahrenheit) com desvio padrão de 10,0°F. Construa um intervalo de confiança de 95% para a temperatura média da população de cafés vendidos. Suponha que as temperaturas tenham uma distribuição aproximadamente normal.

**Resposta**:

Temos um desvio padrão populacional desconhecido, uma amostra aleatória e uma distribuição que se aproxima de uma normal. Portanto, podemos utilizar a distribuição t.

Agora, vamos calcular o erro padrão.

In [21]:
# Funções matématicas
from math import sqrt
import scipy.stats as st

# Calculando o erro padrão
erro_padrao = 10 / sqrt(16)

Agora que já temos o erro padrão, vamos seguir para o cálculo dos intervalos de confiança.

In [22]:
# Criando o objeto da distribuição
distribuicao_t = st.t(df=15, loc=162.0, scale=erro_padrao)

# Calculando o intervalo de confiança
intervalo_confianca = distribuicao_t.interval(confidence=0.95)

# Exibindo o resultado
print(f"Intervalo de confiança: {intervalo_confianca}")

Intervalo de confiança: (156.67137613610169, 167.32862386389831)


Dessa forma, podemos afirmar que temos 95% de confiança de que a temperatura média dos cafés vendidos está entre 156,67°F e 167,32°F.

### Teste de hipóteses para médias quando o **desvio-padrão populacional é conhecido**

Quando temos um desvio-padrão populacional conhecido, padronizamos
nossa média com o teste z utilizando a seguinte formula:

- $Z = (X̄ - μ) / (σ / √n)$

Onde:

Z: Valor do teste Z

X̄: Média da amostra

μ: Média da população (hipótese)

σ: Desvio padrão da população (conhecido)

n: Tamanho da amostra

Utilizando essa formula obteremos o z-calculado a partir dai temos duas opções:

- Podemos comparar o z calculado com o z critico, caso o z critico seja maior que o z calculado nos teremos evidencias suficientes para concordar com  a hipotese alternativa. (Existem sites que calculam o nosso z critico, basta passarmos o tipo do teste unicaudal e o nivel de significancia)

- Podemos calcular o p-valor e comparar com o nosso alpha.
  - Se o valor p for menor que $α$, rejeitamos a hipótese nula.
  - Se o valor p for maior ou igual a $α$, falhamos em rejeitar a hipótese nula.

Vamos observar o seguinte exemplo

**Exemplo**: Em corrida de carros, o pit stop é o local em que um veículo vai
para trocar pneus, abastecer, efetuar reparos e outros ajustes mecânicos. A
eficiência de uma equipe que realiza esses ajustes pode afetar o resultado de
uma corrida. Uma equipe afirma que seu tempo médio no pit stop (para 4
trocas de pneus e abastecimento) é menor que 13 segundos. Uma amostra
aleatória de 32 tempos de pit stop tem uma média de 12,9 segundos.
Suponha que o desvio padrão populacional é de 0,19 segundos. Há
evidência suficiente para concordar com a afirmação para 99% de confiança?

**Resposta**: Vamos começar especificando as hipóteses:

H0: pit stop ≥ 13 segundos

Ha: pit stop < 13 segundos

É importante notar que a hipótese alternativa geralmente expressa o efeito que estamos tentando detectar, enquanto a hipótese nula é a posição inicial ou o status quo que estamos tentando testar.

Levando em consideração que sabemos o desvio da população e temos uma amostra normalmente distribuída, já que temos 32 elementos (seguindo o teorema do limite central, essa distribuição vai estar bem próxima de uma normal, já que possui mais que 30 elementos). Dessa forma, podemos utilizar o teste Z.

Para nos auxiliar na realização dos cálculos, vamos realizar algumas importações.

In [23]:
# Importando funcionalidades relacionadas à distribuição normal.
from scipy.stats import norm

# Funções matématicas
import numpy as np

Agora podemos seguir para o cálculo do nosso Z calculado.

In [24]:
# Definindo a média da amostra
media_amostra = 12.9

# Definindo a média populacional
media_populacional = 13

# Definindo o desvio padrão populacional
desvio_padrao_populacional = 0.19

# Definindo o tamanho da amostra
tamanho_amostra = 32

# Calculando o z-score
z_score = (media_amostra - media_populacional) / (desvio_padrao_populacional / (np.sqrt(tamanho_amostra)))

# Exibindo o z_score
print(z_score)

-2.977291710259137


Agora que temos o valor de Z, vamos seguir para o cálculo do p-valor.

In [25]:
# Calculando o valor p
valor_p = norm.cdf(z_score)

# Definindo o alpha
alpha = 0.01

# Conclusões
if valor_p < alpha:
    print("Rejeitar H0: Há evidência suficiente para concluir que a média do tempo de pit stop é inferior a 13 segundos com 99% de confiança.")
else:
    print("Falha em rejeitar H0: Não há evidência suficiente para concluir que a média do tempo de pit stop é inferior a 13 segundos com 99% de confiança.")

# Exibindo o p_valor
print(f"\nO p-valor: {valor_p}")

Rejeitar H0: Há evidência suficiente para concluir que a média do tempo de pit stop é inferior a 13 segundos com 99% de confiança.

O p-valor: 0.0014540358484991462


Como podemos observar, a hipótese nula foi rejeitada pois o p-valor foi menor que o alfa. Dessa forma, podemos afirmar com 99% de confiança que temos evidências suficientes para concluir que o tempo médio de pitstop é superior a 13 segundos.

### Teste de hipóteses para médias quando o **desvio-padrão populacional é desconhecido**

O teste de hipótese para a média quando o desvio padrão populacional é desconhecido é comumente realizado utilizando o teste t de Student. Aqui está a fórmula para calcular o valor do teste t:

$ t = \frac{{\bar{x} - \mu}}{{s/\sqrt{n}}} $

Onde:
- $( \bar{x} )$ é a média da amostra,
- $( \mu )$ é a média da população (valor sob a hipótese nula),
- $( s )$ é o desvio padrão da amostra
- $( n )$ é o tamanho da amostra.


**Exemplo**: Uma indústria afirma que o nível médio do pH da água em um rio
próximo é de 6,8. Você seleciona aleatoriamente 39 amostras de água e mede
o pH de cada uma. A média amostral e o desvio padrão são de 6,7 e 0,35,
respectivamente. Há evidência suficiente para rejeitar a afirmação da
indústria considerando nível de significância α = 0,05?

Aqui, temos mais de 30 elementos, então a nossa distribuição se aproximará de uma normal. Queremos saber se existe diferença entre as médias e conhecemos apenas o desvio padrão populacional. Dito isso, vamos identificar as hipóteses:

H0: pH médio = 6,8

Ha: pH médio ≠ 6,8

Este teste é bicaudal.

Levando em consideração que nossa amostra é maior que 30, vamos utilizar o teste T.

Vamos importar a biblioteca necessária para a realização do teste e partir para o cálculo.

In [26]:
# Importando a função t
from scipy.stats import t

Agora vamos aplicar a fórmula do teste T.

In [27]:
# Definindo os valores
media_amostral = 6.7
media_populacional = 6.8
desvio_padrao_amostral = 0.35
tamanho_amostra = 39
nivel_significancia = 0.05

# Graus de liberdade
graus_liberdade = tamanho_amostra - 1

# Calculando o valor do teste t
t_score = (media_amostral - media_populacional) / (desvio_padrao_amostral / (tamanho_amostra ** 0.5))

# Exibindo o valor de t_score
print(t_score)

-1.7842851423995363


Agora que temos o valor de t, vamos calcular o p-valor. É importante frisar que, por se tratar de um teste bicaudal, devemos multiplicar por 2 o valor encontrado na fórmula para considerarmos as duas caudas. Se fosse um teste unicaudal, essa multiplicação não seria necessária.

In [28]:
# Calculando o valor p
valor_p = 2 * (1 - t.cdf(abs(t_score), graus_liberdade))

# Comparando com o nível de significância
if valor_p < nivel_significancia:
    print("Rejeitar H0: Há evidência suficiente para rejeitar a afirmação da indústria.")
else:
    print("Falha em rejeitar H0: Não há evidência suficiente para rejeitar a afirmação da indústria.")

# Exibindo o p-valor
print(f"\nO valor p é: {valor_p}")

Falha em rejeitar H0: Não há evidência suficiente para rejeitar a afirmação da indústria.

O valor p é: 0.08236385181341821


Dados os resultados do teste de hipóteses com um nível de significância de 0,05, falhamos em rejeitar a hipótese nula de que a média de pH da água é igual a 6,8. Portanto, não há evidências suficientes para afirmar que a média de pH da água difere de 6,8.

### **Exercicios Testes de hipóteses (1 amostra)**

Aqui vamos responder alguns exercícios com o intuito de maximizar o entendimento no assunto.

#### **1º Questão**

Suponha que você tenha uma amostra de altura de 50 pessoas de uma determinada população e queira testar se a altura média dessa população é maior que 170 cm. A média da sua amostra é 172 cm, com um desvio padrão populacional de 5 cm. Use um nível de significância de 0,05.

**Resposta**: Levando em consideração que temos uma amostra com mais de 30 elementos, possuindo uma distribuição que provavelmente se aproxima de uma normal, e conhecemos o desvio padrão populacional, podemos utilizar o teste Z. Dito isso, vamos determinar quais são as hipóteses:

H0: altura média ≤ 170

Ha: altura média > 170

Nosso teste é unicaudal à direita.

Com as hipóteses definidas, podemos seguir adiante com a importação de alguns pacotes.

In [29]:
# Importando funcionalidades relacionadas à distribuição normal.
from scipy.stats import norm

# Funções matématicas
import numpy as np

Agora vamos aplicar a fórmula do z calculado.

In [30]:
# Definindo a média da amostra
media_amostra = 172

# Definindo a média populacional
media_populacional = 170

# Definindo o desvio padrão populacional
desvio_padrao_populacional = 5

# Definindo o tamanho da amostra
tamanho_amostra = 50

# Calculando o z-score
z_score = (media_amostra - media_populacional) / (desvio_padrao_populacional / (np.sqrt(tamanho_amostra)))

# Exibindo o z_score
print(z_score)

2.8284271247461903


Agora que temos o valor de Z, vamos seguir para o cálculo do p-valor.

In [31]:
# Calculando o valor-p
valor_p = 1 - norm.cdf(z_score)

# Definindo o alpha
alpha = 0.05

# Conclusões
if valor_p < alpha:
    print("Rejeitar H0: A altura média da população é maior que 170 cm.")
else:
    print("Falha em rejeitar H0: A altura média da população não é maior que 170 cm.")

# Exibindo o p_valor
print(f"\nO p-valor: {valor_p}")

Rejeitar H0: A altura média da população é maior que 170 cm.

O p-valor: 0.0023388674905235884


Dados os resultados do teste de hipóteses com um nível de significância de 0,05, rejeitamos a hipótese nula e concluímos que há evidências suficientes para afirmar que a altura média da população é maior que 170 cm.

#### **2º Questão**

Suponha que você trabalhe em uma fábrica de lâmpadas e deseje testar se a vida média de uma nova linha de lâmpadas LED é superior a 1000 horas. Você testa uma amostra de 40 lâmpadas e encontra que a vida média é de 1025 horas, com um desvio padrão amostral de 50 horas. Use um nível de significância de 0,05.

Dessa vez, temos o desvio padrão da amostra conhecido e o desvio populacional desconhecido. Também temos 40 elementos, então será interessante aplicarmos o teste t. Vamos formular as hipóteses:

H0: Vida média da lâmpada de LED ≤ 1000

Ha: Vida média da lâmpada de LED > 1000

Estamos diante de um teste unicaudal à direita.

Vamos seguir adiante para a importação das funções necessárias.

In [32]:
# Importando funcionalidades relacionadas à distribuição normal.
from scipy.stats import norm

# Funções matématicas
import numpy as np

Agora vamos aplicar a fórmula.

In [33]:
# Definindo a média da amostra
media_amostra = 1025

# Definindo a média populacional
media_populacional = 1000

# Definindo o desvio padrão populacional
desvio_padrao_populacional = 50

# Definindo o tamanho da amostra
tamanho_amostra = 40

# Calculando o z-score
z_score = (media_amostra - media_populacional) / (desvio_padrao_populacional / (np.sqrt(tamanho_amostra)))

# Exibindo o z_score
print(z_score)

3.1622776601683795


Agora que temos o valor de Z, vamos seguir para o cálculo do p-valor.

In [34]:
# Calculando o valor-p
valor_p = 1 - norm.cdf(z_score)

# Definindo o alpha
alpha = 0.05

# Conclusões
if valor_p < alpha:
    print("Rejeitar H0: A lâmpada possui mais de 1000 horas.")
else:
    print("Falha em rejeitar H0: A lâmpada possui menos de 1000 horas.")

# Exibindo o p_valor
print(f"\nO p-valor: {valor_p}")

Rejeitar H0: A lâmpada possui mais de 1000 horas.

O p-valor: 0.0007827011290012509


Dados os resultados do teste de hipóteses com um nível de significância de 0,05, rejeitamos a hipótese nula de que a vida média da lâmpada de LED é igual ou menor que 1000 horas. Portanto, há evidências suficientes para afirmar que a vida média da lâmpada de LED é maior que 1000 horas.

#### **3º Questão**

Um nutricionista acredita que o teor médio de açúcar em uma determinada marca de cereal é inferior a 8 gramas por porção. Com uma amostra de 30 pacotes de cereal, ele obteve uma média de 7,5 gramas de açúcar. Realize um teste de hipótese com nível de significância de 5% para verificar se a afirmação do nutricionista é válida. Use o desvio padrão amostrao de 0.03g.

Resposta: Aqui nós temos 30 elementos, então a distribuição pode se aproximar de uma normal e temos o desvio padrão da amostra, logo podemos aplicar o teste t. Então vamos começar definindo as hipóteses:

H0: Teor médio de açúcar ≥ 8

Ha: Teor médio de açúcar < 8

Aqui temos uma distribuição unilateral à esquerda.

Para realizar esse teste, vamos importar algumas bibliotecas necessárias.

In [35]:
# Importando a função t
from scipy.stats import t

# Funções matématicas
import numpy as np

Agora podemos partir para o cálculo do teste t.

In [36]:
# Definindo os valores
media_amostral = 7.5
media_populacional = 8
desvio_padrao_amostral = 0.03
tamanho_amostra = 30

# Alpha
nivel_significancia = 0.05

# Graus de liberdade
graus_liberdade = tamanho_amostra - 1

# Calculando o valor do teste t
t_score = (media_amostral - media_populacional) / (desvio_padrao_amostral / (np.sqrt(tamanho_amostra)))

# Exibindo o valor de t_score
print(t_score)

-91.28709291752769


Agora vamos calcular o nosso p-valor.

In [37]:
# Calculando o p-valor (usando a distribuição t de Student)
p_valor = t.cdf(t_score, df= graus_liberdade)

# Exibindo o p_valor
p_valor

1.5765076797027478e-37

Agora que temos o p-valor, vamos tirar as conclusões.

In [38]:
# Conclusões
if p_valor < alpha:
  print("Rejeitar H0: Existem evidências para acreditarmos que o teor médio do açúcar é inferior a 8 gramas.")
else:
  print("Falha em rejeitar H0: Não existem evidências para acreditarmos que o teor médio do açúcar é inferior a 8 gramas.")

Rejeitar H0: Existem evidências para acreditarmos que o teor médio do açúcar é inferior a 8 gramas.


Após realizar o nosso teste a um nível de significância de 0,05, rejeitamos a hipótese nula. Logo, podemos concluir que existem evidências para que o teor médio de açúcar realmente seja inferior a 8 gramas.

### **Como escolher um teste**

Relembrando quais são os requisitos para escolher entre usar o teste Z ou o teste t, depende das características dos dados e do que se conhece sobre a população.

**Teste Z**:

Use o teste Z quando:

- O desvio padrão populacional é conhecido.

- O tamanho da amostra é grande (geralmente acima de 30).

**Teste t de Student**:

Use o teste t de Student quando:

- O desvio padrão populacional é desconhecido.

- O tamanho da amostra é pequeno (geralmente abaixo de 30) ou desconhecido.

- Intervalos de confiança para a média com amostras pequenas ou quando o desvio padrão populacional é desconhecido.

Em resumo, se você conhece o desvio padrão populacional e está lidando com uma amostra grande, geralmente é seguro usar a teste Z. No entanto, se o desvio padrão populacional não for conhecido ou se estiver lidando com uma amostra pequena, é mais apropriado usar a teste t de Student.

## **Testes de Hipóteses para Médias (2 Amostras)**

Antes de mais nada precisamos entender alguns conceitos importante para a aplicação desses testes sendo eles:

- Amostras dependentes: Quando cada elemento de uma amostra corresponde a um elemento de outra amostra, dessa forma eles ficam meio que 'interligados'

Exemplo: Você mede o peso de uma pessoa antes e depois de uma dieta. As medidas antes e depois estão interligadas para cada indivíduo, já que se referem à mesma pessoa.

- Amostras independentes: Quando a amostra selecionada de uma população não tem nenhuma relação com a outra amostra selecionada

Exemplo: Você compara as alturas de estudantes de duas turmas diferentes. As alturas dos alunos de uma turma não têm relação direta com as alturas dos alunos da outra turma; são conjuntos distintos de indivíduos.

### Desvio-padrão populacional **conhecido e amostras independentes**

Nesse caso também podemos usar um teste z, a formula é a seguinte:

$$
Z = \frac{{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)}}{{\sqrt{\frac{{\sigma_1^2}}{{n_1}} + \frac{{\sigma_2^2}}{{n_2}}}}}
$$

Onde:
- $( \bar{X}_1 ) e ( \bar{X}_2 )$ são as médias das duas amostras,
- $( \mu_1 )$ e $( \mu_2 )$ são as médias populacionais (ou a média hipotética),
- $( \sigma_1 )$ e $( \sigma_2 )$ são os desvios padrão populacionais das duas amostras,
- $( n_1 )$ e $( n_2 )$ são os tamanhos das duas amostras.


Para aplicarmos esse teste temos que cumprir os seguintes requisitos:

- Os desvios padrão populacionais são conhecidos.
- As amostras são selecionadas aleatoriamente.
- As amostras são independentes.
- As populações são normalmente distribuídas ou cada tamanho de amostra
é de pelo menos 30 elementos.

Vamos observar um exemplo para entendermos melhor o assunto:

Um estudo foi realizado para comparar o desempenho médio de duas turmas em um teste de matemática. Uma amostra de 40 alunos da Turma A teve um desempenho médio de 75, com um desvio padrão populacional de 10. Uma amostra de 35 alunos da Turma B teve um desempenho médio de 70, com um desvio padrão populacional de 12. Com um nível de significância de 0,05, teste se há uma diferença significativa no desempenho médio entre as duas turmas.

Vamos iniciar definindo nossas hipóteses:

H0: média do grupo A = média do grupo B

Ha: média do grupo A ≠ média do grupo B

Este é um teste bicaudal.

Vamos prosseguir para o cálculo

In [39]:
# Importar a biblioteca numpy
import numpy as np

# Importar a função norm
from scipy.stats import norm

# Médias amostrais
media_a = 75
media_b = 70

# Desvio padrão populacional
desvio_a = 10
desvio_b = 12

# Tamanho da amostra
amostra_a = 40
amostra_b = 35

# Nível de significância
alpha = 0.05

Agora que já separamos todos os dados, vamos substituir na fórmula de Z, já que cumprimos todos os requisitos necessários para a implementação do mesmo.

In [40]:
# Calculando o Z
z = (media_a - media_b) / np.sqrt((desvio_a**2/amostra_a) + (desvio_b**2/amostra_b))

# Exibindo o valor de z
print(z)

1.9441444452997994


Agora que temos o valor de Z, vamos seguir para o cálculo do p-valor.

In [41]:
# Calcular o valor p para um teste bicaudal
p_valor= 2 * (1 - norm.cdf(abs(z)))

# Conclusões
if p_valor < alpha:
    print("Rejeitar H0: Há evidências de que existe diferença de desemepenho.")
else:
    print("Falha em rejeitar H0: Não há evidências de que existe diferença de desempenho.")

# Exibindo o p_valor
print(f"\nO p-valor: {p_valor}")

Falha em rejeitar H0: Não há evidências de que existe diferença de desempenho.

O p-valor: 0.051878034893831915


Dados os resultados do teste de hipótese a um nível de significância de 0,05, não podemos rejeitar a hipótese nula. Portanto, não há evidências suficientes para afirmar que o desempenho das duas turmas são diferentes.

### Desvio-padrão populacional **desconhecido e amostras independentes**

A realização dos cálculos desse teste é um pouco mais complexa do que os outros por conter mais passos para a sua resolução. Hoje em dia existem ferramentas que nos auxiliam nesse cálculo, como por exemplo o seguinte site:

- https://select-statistics.co.uk/calculators/two-sample-t-test-calculator/

Esse site já nos retornará diretamente o valor p assim que passarmos os dados, como média, desvio padrão e tamanho das duas amostras. Logo, basta pegarmos o valor p que ele vai retornar e comparar com o nosso alfa. Outra solução é utilizar uma função do pacote scipy, que é a função que abordaremos neste momento. Dito isso, vamos seguir adiante.

Para aplicarmos esse teste temos que seguir:

- Os desvios padrão populacionais são desconhecidos
- As amostras são selecionadas aleatoriamente
- As amostras são independentes
- As amostras são normalmente distribuídas ou cada tamanho de
- amostra é de pelo menos 30

Vamos observar o seguinte exemplo:

Os resultados de um teste estadual de matemática para amostras aleatórias
de estudantes ensinados por dois professores diferentes na mesma escola.
Podemos concluir que há diferença nas pontuações médias dos testes de
matemática para todos os estudantes dos dois professores? Use confiança de
90%. Suponha que as populações são normalmente distribuídas e que as
variâncias populacionais não são iguais.

**Dados do professor 1**

- x1 = 473
- s1 = 39.7
- n1 = 8

**Dados do professor 2**
- x2 = 459
- s2 = 24.5
- n2 = 18



**Resposta**: Vamos organizar as hipóteses.

H0: Média do Professor 1 = Média do Professor 2

Ha: Média do Professor ≠ Média do Professor 1

Este é um teste bicaudal.

Para realização deste cálculo, vamos utilizar uma função do SciPy. Então, vamos realizar a sua importação.

In [42]:
# importando a função
from scipy import stats

Agora vamos realizar o cálculo propriamente dito.

In [43]:
# Dados do professor 1
media_1 = 473
desvio_1 = 39.7
amostra_1 = 8

# Dados do professor 2
media_2 = 459
desvio_2 = 24.5
amostra_2 = 18

# Realizando o teste t
# O argumento equal_var=False indica que as variâncias populacionais não são assumidas como iguais
statistic, p_valor = stats.ttest_ind_from_stats(media_1, desvio_1, amostra_1, media_2, desvio_2, amostra_2, equal_var=False)

# Nível de significância
alpha = 0.10

if p_valor < alpha:
    print("Rejeitar H0: Há evidências de que há diferença nas pontuações médias dos testes de matemática.")
else:
    print("Falha em rejeitar H0: Não há evidências suficientes para afirmar que há diferença nas pontuações médias dos testes de matemática.")

# Exibindo o p-valor
print(p_valor)

Falha em rejeitar H0: Não há evidências suficientes para afirmar que há diferença nas pontuações médias dos testes de matemática.
0.37924039002820076


Dado o nosso teste de hipótese utilizando um nível de confiança de 0,1, falhamos em rejeitar a hipótese nula. Logo, podemos concluir que não há evidências suficientes para afirmar que existe diferença nas médias dos testes.

### Desvio-padrão populacional **desconhecido e amostras dependentes**

Para a execução desse teste será necessario seguirmos os seguintes passos:

Claro! Aqui está o passo a passo para a resolução do teste t pareado, juntamente com as fórmulas, em formato Markdown:

Passo 1: Calcular as diferenças entre as observações antes e depois:

- $
\text{Diferença} = \text{Depois} - \text{Antes}
$

Passo 2: Calcular a média das diferenças:

- $
\bar{D} = \frac{1}{n} \sum_{i=1}^{n} D_i
$

Passo 3: Calcular o desvio padrão das diferenças:

- $
s_D = \sqrt{\frac{\sum_{i=1}^{n}(D_i - \bar{D})^2}{n-1}}
$

Passo 4: Calcular a estatística t:

- $
t = \frac{\bar{D}}{\frac{s_D}{\sqrt{n}}}
$

Passo 5: Calcular o valor p utilizando a distribuição t de Student:

- $
\text{Valor p} = 2 \times (1 - \text{cdf}(|t|, \text{graus de liberdade}))
$

Passo 6: Comparar o valor p com o nível de significância e interpretar o resultado.



Condições para aplicar esse teste:

- As amostras são selecionadas aleatoriamente.
- As amostras são dependentes (emparelhadas)
- As populações são normalmente distribuídas ou o número n de pares
de dados é pelo menos 30.

Vamos observar um exemplo para tentarmos entender melhor o assunto:

**Exemplo**: Suponha que você tenha os seguintes dados de medidas de pressão arterial antes e depois de um tratamento para cinco pacientes:

Antes: [120, 130, 125, 140, 128]

Depois: [118, 128, 120, 135, 126]

Determinar se houve uma diferença significativa na pressão arterial antes e depois do tratamento utilizando um nível de significância de 0,05.

Resposta: Para a resolução desse exercício será necessário a importação de algumas bibliotecas. Dito isso, vamos realizar as importações.

In [44]:
# Funções matématicas
import numpy as np
from scipy import stats

Agora vamos definir as nossas hipóteses:

H0: pressão antes = pressão depois

Ha: pressão antes ≠ pressão depois

Com as hipóteses definidas, podemos partir para a aplicação das fórmulas.

Importante frisarmos que, embora não tenhamos 30 amostras, estamos considerando que a distribuição da população se aproxima de uma normal, as amostras são aleatórias e as variáveis são dependentes. Logo, podemos implementar o teste t pareado.

In [45]:
# Dados da pressão antes e depois do tratamento
antes = [120, 130, 125, 140, 128]
depois = [118, 128, 120, 135, 126]

# Passo 1: Calcular as diferenças entre as observações antes e depois
diferencas = np.array(depois) - np.array(antes)

# Passo 2: Calcular a média das diferenças
media_diferencas = np.mean(diferencas)

# Passo 3: Calcular o desvio padrão das diferenças
desvio_padrao_diferencas = np.std(diferencas, ddof=1)

# Passo 4: Calcular a estatística t
t_statistic = media_diferencas / (desvio_padrao_diferencas / np.sqrt(len(antes)))

# Passo 5: Calcular o valor p, por se tratar de um teste bicaudal, multiplicamos por 2
graus_de_liberdade = len(antes) - 1
p_valor = 2 * (1 - stats.t.cdf(abs(t_statistic), graus_de_liberdade))

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_valor < alpha:
  print("Rejeitar H0: Há evidências da diferença entre os exames antes e depois do tratamento.")
else:
  print("Falha em rejeitar H0: Não existem evidências da diferença entre os exames antes e depois do tratamento.")

# Exibindo o p-valor
print(p_valor)

Rejeitar H0: Há evidências da diferença entre os exames antes e depois do tratamento.
0.01211283539994401


Com base no resultado do teste utilizando um nível de significância de 0,05, rejeitamos H0. Logo, podemos concluir que há evidências da diferença entre os resultados dos exames antes e depois do tratamento.

## **Teste de Hipótese de Proporção (1 amostra)**

**Quando utilizar**: Este teste é utilizado quando queremos comparar uma proporção amostral com uma proporção conhecida ou esperada da população.

Hipóteses:

- H0: p = p0 (a proporção da população é igual a um valor específico)
- Ha: p ≠ p0 (a proporção da população é diferente de um valor específico)


Estatística do Teste (Z):

- $Z = (p̂ - p0) / √(p0(1 - p0) / n)$

**Exemplo**:
Suponha que você queira testar se a proporção de clientes satisfeitos com um produto é diferente de 0.75. Você seleciona uma amostra de 100 clientes e encontra que 70 deles estão satisfeitos. Use um nível de significância de 0.05 para realizar o teste de hipótese.

**Resposta**: Primeiro, vamos começar definindo as nossas hipóteses:

H0: proporção de satisfeitos = 0,75

Ha: proporção de satisfeitos ≠ 0,75

Este é um teste bicaudal.

Agora podemos começar importando algumas bibliotecas que serão necessárias.

In [46]:
# Funções matématicas
import numpy as np
from scipy import stats

# Importar a função norm
from scipy.stats import norm

Agora vamos partir para os cálculos, dividindo-os em etapas.

In [47]:
# Dados do problema
p0 = 0.75  # proporção esperada
n = 100    # tamanho da amostra
x = 70     # número de clientes satisfeitos
alpha = 0.05 #  nível de significância

# Calculando a proporção da amostra
p_hat = x / n

# Calculando a estatística Z
Z = (p_hat - p0) / np.sqrt(p0 * (1 - p0) / n)

# Imprimindo os resultados
print("Estatística Z:", Z)

Estatística Z: -1.1547005383792526


Agora podemos calcular o valor de p.

In [48]:
# Calculando o valor p
p_valor = 2 * (1 - norm.cdf(abs(Z)))

# Conclusões
if p_valor < alpha:
  print("Rejeitar H0: Há evidências da diferença na proporção de satisfeitos")
else:
  print("Falha em rejeitar H0: Não existe evidências da diferença na proporção de satisfeitos")

# Exibindo o p_valor
print(f"\nO p-valor: {p_valor}")

Falha em rejeitar H0: Não existe evidências da diferença na proporção de satisfeitos

O p-valor: 0.24821307898992329


Com base no teste que executamos e em um nível de significância de 0,05, falhamos em rejeitar a hipótese nula. Portanto, podemos concluir que não existem evidências de diferença na proporção de clientes satisfeitos.

## **Teste de Hipótese de Proporção (2 amostras)**

**Quando utilizar**: Este teste é utilizado quando queremos comparar as proporções de duas amostras independentes.

Hipóteses:

- H0: p1 - p2 = 0 (não há diferença entre as proporções das duas populações)
- Ha: p1 - p2 ≠ 0 (há diferença entre as proporções das duas populações

Estatística do Teste (Z):

- $Z = ((p̂1 - p̂2) - 0) / √(p̂(1 - p̂)((1/n1) + (1/n2)))
$

Logo de cara, parece ser uma fórmula assustadora, mas vamos observar um exemplo da aplicação da mesma.

**Exemplo**:
Suponha que você queira testar se a proporção de clientes satisfeitos com um produto é diferente entre duas regiões. Você seleciona uma amostra de 100 clientes de cada região e encontra que 70 clientes na região A estão satisfeitos, enquanto 60 clientes na região B estão satisfeitos. Use um nível de significância de 0.05 para realizar o teste de hipótese.

**Resposta**: Vamos começar definindo as nossas hipóteses:

H0: Proporção de satisfeitos na região A = Proporção de satisfeitos na região B

Ha: Proporção de satisfeitos na região A ≠ Proporção de satisfeitos na região B

Nos deparamos novamente com um teste bicaudal.

Agora vamos realizar algumas importações necessárias.

In [49]:
# Funções matématicas
import numpy as np
from scipy import stats

# Importar a função norm
from scipy.stats import norm

Agora podemos partir para os cálculos propriamente ditos.

In [50]:
# Dados do problema
n1 = 100   # tamanho da amostra região A
n2 = 100   # tamanho da amostra região B
x1 = 70    # número de clientes satisfeitos na região A
x2 = 60    # número de clientes satisfeitos na região B

# nível de significância
alpha = 0.05

# Calculando as proporções das amostras
p_hat1 = x1 / n1
p_hat2 = x2 / n2

# Calculando a proporção combinada
p_hat = (x1 + x2) / (n1 + n2)

# Calculando a estatística Z
Z = (p_hat1 - p_hat2) / np.sqrt(p_hat * (1 - p_hat) * (1/n1 + 1/n2))

print("Estatística Z:", Z)

Estatística Z: 1.482498633322202


Agora vamos partir para o cálculo do valor-p.

In [51]:
# Calculando o valor p
p_valor = 2 * (1 - norm.cdf(abs(Z)))

# Conclusões
if p_valor < alpha:
  print("Rejeitar H0: Há evidências da diferença de clientes satisfeitos da região A e B.")
else:
  print("Falha em rejeitar H0: Não existe evidências da diferença de clientes satisfeitos da região A e B.")

# Imprimindo o p_valor
print("\nValor p:", p_valor)

Falha em rejeitar H0: Não existe evidências da diferença de clientes satisfeitos da região A e B.

Valor p: 0.13820766697402576


Após aplicarmos o nosso teste de hipótese com um nível de significância de 0,05, falhamos em rejeitar a hipótese nula. Logo, podemos concluir que não existe diferença na satisfação dos clientes entre as regiões A e B.