# Teste de Hipóteses - Análise Estatística com Python

In [3]:
import pandas as pd
import numpy as np
from scipy.stats import ttest_1samp, ttest_ind, f_oneway, chi2_contingency, pearsonr, t, shapiro, norm

# Carregando os dados
experimento_df = pd.read_csv('experimento_teste_ab.csv')
pacientes_df = pd.read_csv('pacientes.csv')

ModuleNotFoundError: No module named 'pandas'

## Exercício 1: Maior taxa de conversão

In [4]:
agrupado = experimento_df.groupby('Versão_Página').agg(
    total_visualizacoes=('Visualizações', 'sum'),
    total_conversoes=('Conversões', 'sum')
)
agrupado['taxa_conversao_%'] = (agrupado['total_conversoes'] / agrupado['total_visualizacoes']) * 100
agrupado

NameError: name 'experimento_df' is not defined

## Exercício 2: Cálculo do tamanho da amostra

In [None]:
p1 = agrupado.loc['A', 'taxa_conversao_%'] / 100
p2 = 0.10
p_bar = (p1 + p2) / 2
z_alpha = norm.ppf(1 - 0.05 / 2)
z_beta = norm.ppf(0.80)
n = (2 * ((z_alpha + z_beta)**2) * p_bar * (1 - p_bar)) / (p2 - p1)**2
round(n)

## Exercício 3: Teste t para média de idades

In [None]:
indices_amostra = [909, 751, 402, 400, 726, 39, 184, 269, 255, 769, 209, 715, 677, 381,
793, 697, 89, 280, 232, 756, 358, 36, 439, 768, 967, 699, 473, 222, 89, 639, 883,
558, 757, 84, 907, 895, 217, 224, 311, 348, 146, 505, 273, 957, 362]
amostra_idades = pacientes_df.loc[indices_amostra, 'Idade']
t_stat, p_bi = ttest_1samp(amostra_idades, popmean=50)
p_uni = p_bi / 2
amostra_idades.mean(), t_stat, p_uni

## Exercício 4: Tipo de Amostra

A amostra é **independente**, pois compara dois grupos distintos sem pareamento.

## Exercício 5: Teste t entre dois grupos

In [None]:
indices_5 = [690, 894, 67, 201, 364, 19, 60, 319, 588, 643, 855, 623, 530, 174,
105, 693, 6, 462, 973, 607, 811, 346, 354, 966, 943, 372]
amostra_5 = pacientes_df.loc[indices_5]
grupo_cond = amostra_5[amostra_5['Estado_Saude'] == 1]['Pressao_Arterial']
grupo_saud = amostra_5[amostra_5['Estado_Saude'] == 0]['Pressao_Arterial']
t_stat, p_valor = ttest_ind(grupo_cond, grupo_saud, equal_var=False)
grupo_cond.mean(), grupo_saud.mean(), t_stat, p_valor

## Exercício 6: Teste ANOVA

In [None]:
grupos_etnia = pacientes_df['Nome_Etnia'].unique()
dados_etnia = [pacientes_df[pacientes_df['Nome_Etnia'] == e]['Pressao_Arterial'] for e in grupos_etnia]
f_stat, p_valor = f_oneway(*dados_etnia)
f_stat, p_valor

## Exercício 7: Teste Qui-Quadrado

In [None]:
contingencia = pd.crosstab(pacientes_df['Nome_Genero'], pacientes_df['Nome_Estado_Saude'])
chi2, p, dof, expected = chi2_contingency(contingencia)
contingencia, chi2, p

## Exercício 8: Correlação entre idade e pressão arterial

In [None]:
correlacao, p_valor = pearsonr(pacientes_df['Idade'], pacientes_df['Pressao_Arterial'])
correlacao, p_valor

## Exercício 9: Intervalo de confiança para pressão arterial

In [None]:
grupo = pacientes_df[pacientes_df['Estado_Saude'] == 1]['Pressao_Arterial']
media = grupo.mean()
std = grupo.std()
n = grupo.count()
t_crit = t.ppf(1 - 0.05/2, df=n-1)
margem = t_crit * (std / np.sqrt(n))
(media - margem, media + margem)

## Exercício 10: Teste de normalidade (Shapiro-Wilk)

In [None]:
shapiro(pacientes_df['Pressao_Arterial'])