In [9]:
import numpy as np
import math
from scipy import stats
from scipy.stats import norm, f, t
from statsmodels.stats.proportion import proportions_ztest


1. As companhias de seguro de automóvel estão cogitando elevar os prêmios para aqueles que falam ao telefone enquanto dirigem. Um grupo de defesa dos consumidores alega que este problema não é tão sério, porque menos de 10% dos motoristas usam o telefone. Uma companhia de seguro faz uma pesquisa e constata que, entre 500 motoristas selecionados aleatoriamente, 72 usam o telefone. Teste a afirmação do grupo de consumidores ao nível de 2% de significância. 

- n = 500
- x = 72

- alpha = 0.02

---

- H0: pa = 10%
- Ha: pa != 10%

In [4]:
x = 72
n = 500
p0 = 0.1
alpha = 0.02

z_statistic, p_value = proportions_ztest(
    count=x, 
    nobs=n, 
    value=p0,
    alternative='two-sided'
)

# --- Apresentar Resultados ---
print(f"Estatística Z: {z_statistic:.4f}")
print(f"P-Valor: {p_value:.4f}")

# --- Conclusão ---
print("\n--- Conclusão ---")
if p_value < alpha:
    print(f"P-Valor ({p_value:.4f}) < Alpha ({alpha}). Rejeitamos H0.")
else:
    print(f"P-Valor ({p_value:.4f}) >= Alpha ({alpha}). Não Rejeitamos H0.")


Estatística Z: 2.8023
P-Valor: 0.0051

--- Conclusão ---
P-Valor (0.0051) < Alpha (0.02). Rejeitamos H0.


> O valor p para o teste é igual a 0,001, indicando que NÃO há evidências que comprovem a alegação do grupo de defesa dos consumidores. 

2. Um banco realiza um estudo idealizado para identificar as diferenças na utilização das contas correntes pelos clientes em duas de suas filiais. Uma amostra aleatória de 28 contas correntes é selecionada da filial situada em CG e uma amostra aleatória independente de 22 contas correntes é selecionada da sua filial em BM. O saldo atual da conta corrente é registrado para cada uma das contas. A seguir temos um resumo dos saldos bancários:

    |  | Filial CG (A) | Filial BM (B) |
    | - | - | - |
    | Média amostral | 1025 | 910 |
    | Desvio padrão amostral | 150 | 125 |

    O saldo médio das contas correntes mantidas pela população de clientes difere entre as duas filiais? Utilize um nível de 5% de significância.

- na = 28
- ma = 1025
- sa = 150

---

- nb = 22
- mb = 910
- sb = 125

--- 

- H0: sigmaA = sigmaB
- Ha: sigmaA != sigmaB

In [5]:
varA = 150
varB = 125

# B. Calcular Graus de Liberdade (df)
nA = 28
nB = 22
df1 = nA - 1
df2 = nB - 1

if varA >= varB:
    F_statistic = varA / varB
    num_df = df1
    den_df = df2
else:
    F_statistic = varB / varA
    num_df = df2
    den_df = df1

p_value_one_tail = f.sf(F_statistic, num_df, den_df)
p_value_two_tail = p_value_one_tail * 2

# --- 4. Conclusão ---
alpha = 0.05

print(f"Variância Grupo 1 (s1^2): {varA:.4f}")
print(f"Variância Grupo 2 (s2^2): {varB:.4f}")
print(f"Graus de Liberdade: ({num_df}, {den_df})")
print(f"Estatística F Observada: {F_statistic:.4f}")
print(f"P-Value Bilateral: {p_value_two_tail:.4f}")

if p_value_two_tail < alpha:
    print(f"\nConclusão (Rejeita H0): O P-Value ({p_value_two_tail:.4f}) < Alpha ({alpha}). Há evidência de que as variâncias são diferentes.")
else:
    print(f"\nConclusão (Não Rejeita H0): O P-Value ({p_value_two_tail:.4f}) >= Alpha ({alpha}). Não há evidência de diferença significativa nas variâncias.")

Variância Grupo 1 (s1^2): 150.0000
Variância Grupo 2 (s2^2): 125.0000
Graus de Liberdade: (27, 21)
Estatística F Observada: 1.2000
P-Value Bilateral: 0.6750

Conclusão (Não Rejeita H0): O P-Value (0.6750) >= Alpha (0.05). Não há evidência de diferença significativa nas variâncias.


- H0: mediaA = mediaB
- Ha: mediaA != mediaB

In [10]:
x_bar_A = 1025
sa = 150

x_bar_B = 910
sb = 125

alpha = 0.05    # Nível de significância

sp_sq = (
    ((nA - 1) * sa**2) + ((nB - 1) * sb**2)
) / (nA + nB - 2)

SE_pooled = math.sqrt(sp_sq * ((1/nA) + (1/nB)))

# Estatística t
t_statistic = (x_bar_A - x_bar_B) / SE_pooled

# Graus de Liberdade
df = nA + nB - 2

p_value_bilateral = t.sf(abs(t_statistic), df) * 2

# --- 5. Resultados e Conclusão ---
print(f"Variância Agrupada (s_p^2): {sp_sq:.4f}")
print(f"Graus de Liberdade (df): {df}")
print(f"Estatística t: {t_statistic:.4f}")
print(f"P-Valor (Bilateral): {p_value_bilateral:.4f}")

if p_value_bilateral < alpha:
    print(f"\nConclusão: P-Valor ({p_value_bilateral:.4f}) < Alpha ({alpha}). Rejeitamos H0.")
else:
    print(f"\nConclusão: P-Valor ({p_value_bilateral:.4f}) >= Alpha ({alpha}). Não Rejeitamos H0.")

# Para teste unilateral, divida o p_value_bilateral por 2 (se a cauda estiver na direção correta do t_statistic).

Variância Agrupada (s_p^2): 19492.1875
Graus de Liberdade (df): 48
Estatística t: 2.8912
P-Valor (Bilateral): 0.0057

Conclusão: P-Valor (0.0057) < Alpha (0.05). Rejeitamos H0.


> As populações são homocedásticas. Ao executar o teste t para comparação de duas médias encontramos um valor p igual a 0,005 indicando que existe diferença significativa no saldo médio das contas correntes mantidas pela população de clientes entre as duas filiais. 

3. Um experimento (hipotético) sobre o efeito do álcool na habilidade perceptual motora é conduzido. 10 indivíduos são testado duas vezes, uma depois de ter tomado dois drinks e uma depois de tomado dois copos de água. Os dois testes foram realizados em dois dias diferentes para evitar influência do efeito do álcool. Metade dos indivíduos tomou a bebida alcoólica primeiro e a outra metade água. Os escores dos 10 indivíduos são mostrados abaixo. Escores mais altos refletem uma melhor performance. 

Indivíduo	Água	Álcool
1	        16	    13
2	        15	    13
3	        11	    12
4	        20	    16
5	        19	    16
6	        14	    11
7	        13	    10
8	        15	    15
9	        14	    9
10	        16	    16

Deseja-se testar se houve alteração na habilidade perceptual motora mediante as duas bebidas testadas. Utilize um nível de significância de 1%.

- H0: mAgua = mAlcool
- Ha: mAgua != mAlcool

In [11]:
A = np.array([16,15,11,20,19,14,13,15,14,16])
B = np.array([13,13,12,16,16,11,10,15,9,16])


x_bar_A = np.mean(A)
sa = np.std(A, ddof=1)

x_bar_B = np.mean(B)
sb = np.std(B, ddof=1)

alpha = 0.01    # Nível de significância

sp_sq = (
    ((nA - 1) * sa**2) + ((nB - 1) * sb**2)
) / (nA + nB - 2)

SE_pooled = math.sqrt(sp_sq * ((1/nA) + (1/nB)))

# Estatística t
t_statistic = (x_bar_A - x_bar_B) / SE_pooled

# Graus de Liberdade
df = nA + nB - 2

p_value_bilateral = t.sf(abs(t_statistic), df) * 2

# --- 5. Resultados e Conclusão ---
print(f"Variância Agrupada (s_p^2): {sp_sq:.4f}")
print(f"Graus de Liberdade (df): {df}")
print(f"Estatística t: {t_statistic:.4f}")
print(f"P-Valor (Bilateral): {p_value_bilateral:.4f}")

if p_value_bilateral < alpha:
    print(f"\nConclusão: P-Valor ({p_value_bilateral:.4f}) < Alpha ({alpha}). Rejeitamos H0.")
else:
    print(f"\nConclusão: P-Valor ({p_value_bilateral:.4f}) >= Alpha ({alpha}). Não Rejeitamos H0.")

# Para teste unilateral, divida o p_value_bilateral por 2 (se a cauda estiver na direção correta do t_statistic).

Variância Agrupada (s_p^2): 6.9667
Graus de Liberdade (df): 48
Estatística t: 2.9256
P-Valor (Bilateral): 0.0052

Conclusão: P-Valor (0.0052) < Alpha (0.01). Rejeitamos H0.


> Ao executar o teste t para comparação de duas médias (amostras pareadas) encontramos um valor p igual a 0,005. Dessa forma, podemos dizer que houve alteração na habilidade perceptual motora mediante as duas bebidas testadas, considerando um nível de 1% de significância. 

4. Uma revista de viagens de negócios quer classificar os aeroportos internacionais de acordo com a avaliação média da população de pessoas que viajam a negócios. Será usada uma escala de classificação, sendo 0 uma avaliação baixa e 10 uma avaliação elevada, e os aeroportos que receberem uma avaliação média populacional maior que 7 serão designados como aeroportos com um atendimento de alto nível. A equipe da revista pesquisou uma amostra de 27 viajantes de negócios em cada aeroporto para obter os dados da avaliação. A amostra do aeroporto de Londres produziu uma avaliação média igual a 7,25 com desvio padrão igual a 1,052. Os dados indicam que o aeroporto de Londres deveria ser designado como um aeroporto de alto nível? Utilize um nível de 5% de significância. 

- H0: m >= 7
- Ha: m < 7

- n = 27
- m = 7.25
- s = 1.052

In [15]:
sample_mean = 7.25
s = 1.052
n = 27

hypothesized_mean = 7
alpha = 0.05

standard_error = s / math.sqrt(n)
Z_statistic = (sample_mean - hypothesized_mean) / standard_error

p_value = norm.sf(abs(Z_statistic))

print(f"Calculated Z-Statistic: {Z_statistic:.4f}")
print(f"P-Value: {p_value:.4f}")

Calculated Z-Statistic: 1.2348
P-Value: 0.1084


> O valor p para o teste é igual a 0,25, indicando que o aeroporto de Londres deve ser designado como um aeroporto de alto nível. 

5. Em um concurso público promovido por uma empresa estatal, os candidatos às vagas de Engenharia constituem a nossa população de interesse. Entre eles, os que se submeteram a uma preparação específica para o concurso constituem a subpopulação A e os que não fizeram essa preparação constituem a sub-população B. Foram coletadas amostras aleatórias em ambas as sub-populações e os resultados obtidos foram os seguintes:

    | Sub-população | Tamanho amostral | Aprovados |
    | - | - | - |
    | Prepararam-se (A) | 140 | 34 |
    | Não se prepararam (B) | 230 | 53 |

    Pode-se dizer que houve diferença na proporção de aprovados entre as duas sub-populações estudadas? Utilize um nível de 10% de significância.

- H0: pa = pb
- Ha: p!= pb

In [18]:
from statsmodels.stats.proportion import proportions_ztest

pa = 140 / 34
pb = 230 / 53


# --- Dados do Teste ---
x = 34             # Número de sucessos (pessoas a favor)
n = 140            # Tamanho da amostra
p0 = pb          # Proporção hipotética (H0: p = 0.50)
alpha = 0.1       # Nível de significância

# --- Realizar o Teste ---
# 'alternative' pode ser 'two-sided' (bilateral), 'smaller' (cauda esquerda), ou 'larger' (cauda direita).
# Vamos começar com um teste bilateral (p != 0.50).
z_statistic, p_value = proportions_ztest(
    count=x, 
    nobs=n, 
    value=p0,
    alternative='two-sided'
)

# --- Apresentar Resultados ---
print(f"Estatística Z: {z_statistic:.4f}")
print(f"P-Valor: {p_value:.4f}")

# --- Conclusão ---
print("\n--- Conclusão ---")
if p_value < alpha:
    print(f"P-Valor ({p_value:.4f}) < Alpha ({alpha}). Rejeitamos H0.")
else:
    print(f"P-Valor ({p_value:.4f}) >= Alpha ({alpha}). Não Rejeitamos H0.")


Estatística Z: -113.0422
P-Valor: 0.0000

--- Conclusão ---
P-Valor (0.0000) < Alpha (0.1). Rejeitamos H0.
