In [11]:
import os
import matplotlib.pyplot as plt
import pandas as pd

# Cargar el dataset limpio
df_cleaned = pd.read_csv("variables_seleccionadas.csv")

# Crear carpeta de salida
output_dir = "gráficas_limpias"
os.makedirs(output_dir, exist_ok=True)

# 1. Gráfico: Distribución de la variable objetivo
plt.figure(figsize=(6, 4))
df_cleaned['riesgo_hipertension'].value_counts().plot(kind='bar')
plt.title("Distribución de la variable objetivo: Riesgo de Hipertensión")
plt.xlabel("Clase")
plt.ylabel("Cantidad de registros")
plt.xticks(ticks=[0, 1], labels=["No riesgo", "Con riesgo"], rotation=0)
plt.tight_layout()
plt.savefig(f"{output_dir}/fig_distribucion_objetivo.png")
plt.close()

# 2. Gráfico: Distribución del IMC (si existe)
if 'imc' in df_cleaned.columns:
    plt.figure(figsize=(6, 4))
    df_cleaned['imc'].plot(kind='hist', bins=30, edgecolor='black')
    plt.title("Distribución del Índice de Masa Corporal (IMC)")
    plt.xlabel("IMC")
    plt.ylabel("Frecuencia")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/fig_distribucion_imc.png")
    plt.close()

# 3. Gráfico: Distribución de Glucosa en Ayuno (si existe)
if 'resultado_glucosa' in df_cleaned.columns:
    plt.figure(figsize=(6, 4))
    df_cleaned['resultado_glucosa'].plot(kind='hist', bins=30, edgecolor='black')
    plt.title("Distribución de Glucosa en Ayuno")
    plt.xlabel("Glucosa (mg/dL)")
    plt.ylabel("Frecuencia")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/fig_distribucion_glucosa.png")
    plt.close()

# 4. Gráfico: Distribución de Colesterol Total (si existe)
if 'valor_colesterol_total' in df_cleaned.columns:
    plt.figure(figsize=(6, 4))
    df_cleaned['valor_colesterol_total'].plot(kind='hist', bins=30, edgecolor='black')
    plt.title("Distribución de Colesterol Total")
    plt.xlabel("Colesterol (mg/dL)")
    plt.ylabel("Frecuencia")
    plt.tight_layout()
    plt.savefig(f"{output_dir}/fig_distribucion_colesterol.png")
    plt.close()

print("✅ Gráficas generadas exitosamente (solo para variables disponibles). Carpeta:", output_dir)

✅ Gráficas generadas exitosamente (solo para variables disponibles). Carpeta: gráficas_limpias


In [13]:
## Este es el bueno!!!!
import os
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el dataset limpio
df_cleaned = pd.read_csv("variables_seleccionadas.csv")

# Calcular correlación con la variable objetivo
correlaciones = df_cleaned.drop(columns=["FOLIO_I"]).corr()["riesgo_hipertension"].drop("riesgo_hipertension")

# Seleccionar las 4 variables con mayor correlación absoluta
top_4 = correlaciones.abs().sort_values(ascending=False).head(4).index.tolist()

# Estilo visual similar al ejemplo proporcionado
sns.set(style="whitegrid")

# Crear carpeta de salida
output_dir = "gráficas_limpias"
os.makedirs(output_dir, exist_ok=True)

# Generar y guardar las gráficas
for var in top_4:
    if var in df_cleaned.columns:
        plt.figure(figsize=(6, 4))
        sns.histplot(df_cleaned[var], bins=30, kde=True, edgecolor='white')
        plt.title(f"Distribución de {var.replace('_', ' ').capitalize()}")
        plt.xlabel(var.replace('_', ' ').capitalize())
        plt.ylabel("Frecuencia")
        plt.tight_layout()
        plt.savefig(f"{output_dir}/fig_distribucion_{var}.png")
        plt.close()

print("✅ Gráficas generadas con estilo uniforme y guardadas en:", output_dir)


✅ Gráficas generadas con estilo uniforme y guardadas en: gráficas_limpias


In [3]:
import pandas as pd
import matplotlib.pyplot as plt
import os

# Cargar el dataset
df = pd.read_csv("Hipertension_Arterial_Mexico.csv")

# Filtrar registros con estatura menor a 100 cm
df_filtrado = df[df["estatura"] < 100]

# Crear carpeta si no existe
output_dir = "gráficas_limpias"
os.makedirs(output_dir, exist_ok=True)

# Crear la gráfica de dispersión
plt.figure(figsize=(8, 4))
plt.scatter(df_filtrado["estatura"], df_filtrado["peso"], alpha=0.7, edgecolors='k')
plt.title("Relación entre estatura y peso en pacientes con estatura < 100 cm")
plt.xlabel("Estatura (cm)")
plt.ylabel("Peso (kg)")
plt.grid(True)
plt.tight_layout()

# Guardar la gráfica
plt.savefig(f"{output_dir}/fig_estatura_menor_100_vs_peso.png")
plt.close()