# 2. Análise Estatística

Este notebook realiza uma análise estatística detalhada das variáveis do dataset.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path
from scipy import stats

# Configurações de visualização
plt.style.use('seaborn')
sns.set_palette('husl')
pd.set_option('display.max_columns', None)

In [None]:
# Carregar dados
data_path = Path('../data/HeartDiseaseTrain-Test.csv')
df = pd.read_csv(data_path)

## Análise de Correlação

In [None]:
# Matriz de correlação
numeric_cols = df.select_dtypes(include=['int64', 'float64']).columns
correlation_matrix = df[numeric_cols].corr()

plt.figure(figsize=(12, 10))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', center=0)
plt.title('Matriz de Correlação')
plt.show()

## Análise por Grupo de Risco

In [None]:
# Comparação de distribuições entre grupos com e sem doença cardíaca
fig, axes = plt.subplots(2, 2, figsize=(15, 12))
axes = axes.flatten()

# Idade
sns.boxplot(data=df, x='target', y='age', ax=axes[0])
axes[0].set_title('Distribuição de Idade por Grupo')

# Pressão arterial
sns.boxplot(data=df, x='target', y='resting_blood_pressure', ax=axes[1])
axes[1].set_title('Distribuição de Pressão Arterial por Grupo')

# Colesterol
sns.boxplot(data=df, x='target', y='cholestoral', ax=axes[2])
axes[2].set_title('Distribuição de Colesterol por Grupo')

# Frequência cardíaca máxima
sns.boxplot(data=df, x='target', y='Max_heart_rate', ax=axes[3])
axes[3].set_title('Distribuição de Frequência Cardíaca Máxima por Grupo')

plt.tight_layout()
plt.show()

## Testes Estatísticos

In [None]:
# Realizar testes t para comparar grupos
numeric_cols = ['age', 'resting_blood_pressure', 'cholestoral', 'Max_heart_rate']
test_results = {}

for col in numeric_cols:
    group1 = df[df['target'] == 0][col]
    group2 = df[df['target'] == 1][col]
    t_stat, p_val = stats.ttest_ind(group1, group2)
    test_results[col] = {'t_statistic': t_stat, 'p_value': p_val}

pd.DataFrame(test_results).T