# 🧪 Prueba de Hipótesis 3: Relación entre Hábito de Fumar/Beber y Diabetes

**Objetivo:** Verificar si existe relación significativa entre el hábito de fumar y/o beber alcohol y la presencia de diabetes.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import chi2_contingency

sns.set(style="whitegrid")

In [None]:
# Cargar datos
data = pd.read_csv('data/diabetes_health_indicators.csv')
data.head()

In [None]:
# Revisar columnas para identificar variables de fumar y beber
data.columns

In [None]:
# Tabla de contingencia: Fumar vs Diabetes
cont_smoke = pd.crosstab(data['Diabetes_012'], data['Smoker'])
print(cont_smoke)

In [None]:
# Prueba de chi-cuadrado para fumar
chi2_smoke, p_smoke, _, _ = chi2_contingency(cont_smoke)
print(f"Estadístico chi-cuadrado (Fumar): {chi2_smoke:.4f}")
print(f"p-valor (Fumar): {p_smoke:.4f}")
if p_smoke < 0.05:
    print("Se rechaza H0: Hay relación significativa entre fumar y diabetes.")
else:
    print("No se rechaza H0: No hay evidencia de relación significativa entre fumar y diabetes.")

In [None]:
# Tabla de contingencia: Beber vs Diabetes
cont_drink = pd.crosstab(data['Diabetes_012'], data['AlcoholDrinking'])
print(cont_drink)

In [None]:
# Prueba de chi-cuadrado para beber
chi2_drink, p_drink, _, _ = chi2_contingency(cont_drink)
print(f"Estadístico chi-cuadrado (Beber): {chi2_drink:.4f}")
print(f"p-valor (Beber): {p_drink:.4f}")
if p_drink < 0.05:
    print("Se rechaza H0: Hay relación significativa entre beber y diabetes.")
else:
    print("No se rechaza H0: No hay evidencia de relación significativa entre beber y diabetes.")