<a href="https://colab.research.google.com/github/andresramirez6-droid/PruebaRepositorio_C.D/blob/master/Entregable2_EnfermedadesMentales.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import numpy as np


# 1. Datos

url = "https://www.datos.gov.co/resource/2uxx-gxp3.json"
df = pd.read_json(url)

print("Total de filas cargadas:", df.shape[0])


# 2. Renombrar columnas principales

df = df.rename(columns={
    "genero": "Genero",
    "nombre_dx": "Diagnostico",
    "ocupacion": "Ocupacion",
})

# 3. Arreglar género de forma simple y correcta
def limpiar_genero(x):
    if pd.isna(x):
        return "Sin información"
    x = str(x).strip().lower()
    if x in ["m", "masculino", "hombre"]:
        return "Masculino"
    if x in ["f", "femenino", "mujer"]:
        return "Femenino"
    return "Otro"

df["Genero"] = df["Genero"].apply(limpiar_genero)


# 4. PRIMERA TABLA

columnas_principales = [
    "Genero",
    "Diagnostico",
    "Ocupacion",

]

# Filtrar columnas que existan realmente en el dataset
columnas_principales = [c for c in columnas_principales if c in df.columns]

tabla_principal = df[columnas_principales].sample(20, random_state=40)

print("\n=== TABLA PRINCIPAL: 20 CASOS ALEATORIOS ")
display(tabla_principal)


# 5. Cantidad por género
print("\n=== CANTIDAD DE CASOS POR GÉNERO ===")
display(df["Genero"].value_counts())



# 6. Diagnósticos más frecuentes
print("\n=== DIAGNÓSTICOS MÁS FRECUENTES ===")
display(df["Diagnostico"].value_counts().head(10))


# 7. Promedios por género
for col in ["peso", "talla", "imc", "edad"]:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col], errors='coerce')

df = df.rename(columns={"edad":"Edad", "peso":"Peso", "talla":"Talla", "imc":"IMC"})
prom_cols = [c for c in ["Edad","Peso","Talla","IMC"] if c in df.columns]

print("\n=== PROMEDIOS POR GÉNERO (Edad, Peso, Talla, IMC) ===")
display(df.groupby("Genero")[prom_cols].mean().round(1))


# 8. Riesgo metabólico

def riesgo(imc):
    if pd.isna(imc):
        return "No evaluado"
    if imc >= 30:
        return "Alto"
    if imc >= 25:
        return "Moderado"
    return "Bajo"

if "IMC" in df.columns:
    df["Riesgo_Metabolico"] = df["IMC"].apply(riesgo)

print("\n=== RIESGO METABÓLICO (10 ejemplos aleatorios) ===")
if "Riesgo_Metabolico" in df.columns:
    display(df[["Edad", "IMC", "Riesgo_Metabolico"]].sample(10))



Total de filas cargadas: 1000

=== TABLA PRINCIPAL: 20 CASOS ALEATORIOS 


Unnamed: 0,Genero,Diagnostico,Ocupacion
204,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),HOGAR
71,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),AMA DE CASA
594,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),OFICIOS VARIOS
672,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),CARPINTERIA
14,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),CESANTE
64,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),CESANTE
340,Femenino,RETINOPATIA DIABETICA,HOGAR
135,Femenino,"HIPOTIROIDISMO, NO ESPECIFICADO",CESANTE
350,Masculino,DESNUTRICION PROTEICOCALORICA MODERADA,HOGARNO REGISTRA CONDUCTOR
976,Femenino,HIPERTENSION ESENCIAL (PRIMARIA),NO REGISTRA



=== CANTIDAD DE CASOS POR GÉNERO ===


Unnamed: 0_level_0,count
Genero,Unnamed: 1_level_1
Femenino,715
Masculino,285



=== DIAGNÓSTICOS MÁS FRECUENTES ===


Unnamed: 0_level_0,count
Diagnostico,Unnamed: 1_level_1
HIPERTENSION ESENCIAL (PRIMARIA),596
"DIABETES MELLITUS NO INSULINODEPENDIENTE, SIN MENCION DE COMPLICACION",47
"HIPOTIROIDISMO, NO ESPECIFICADO",30
"OBESIDAD, NO ESPECIFICADA",28
"ENFERMEDAD PULMONAR OBSTRUCTIVA CRONICA, NO ESPECIFICADA",22
"DIABETES MELLITUS INSULINODEPENDIENTE, SIN MENCION DE COMPLICACION",14
HIPERLIPIDEMIA MIXTA,14
HIPERLIPIDEMIA NO ESPECIFICADA,13
PTERIGION,12
HIPERPLASIA DE LA PROSTATA,9



=== PROMEDIOS POR GÉNERO (Edad, Peso, Talla, IMC) ===


Unnamed: 0_level_0,Edad,Peso,Talla,IMC
Genero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Femenino,68.4,63.3,149.6,29.8
Masculino,71.3,65.1,160.7,24.8



=== RIESGO METABÓLICO (10 ejemplos aleatorios) ===


Unnamed: 0,Edad,IMC,Riesgo_Metabolico
126,72,31.16,Alto
988,65,30.49,Alto
417,47,27.74,Moderado
99,68,26.66,Moderado
744,74,34.65,Alto
138,68,26.66,Moderado
658,76,26.78,Moderado
813,63,25.71,Moderado
430,73,25.54,Moderado
222,71,43.24,Alto
