In [4]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from typing import Dict
import numpy as np


In [11]:
def cargar_datos(datos_biosanitarios_sinteticos: str) -> pd.DataFrame:
    """ Carga los datos desde un archivo CSV y maneja posibles errores """
    try:
        df = pd.read_csv(datos_biosanitarios_sinteticos)
        print("Datos cargados exitosamente")
        return df
    except Exception as e:
        print(f"Error al cargar los datos: {e}")
        return None
    
    


In [13]:
def realizar_analisis_exploratorio(df: pd.DataFrame) -> None: 
    """ Realiza y muestra un análisis exploratorio básico del dataset """ 
    print("\n=== ANÁLISIS EXPLORATORIO INICIAL ===") 
    
    print("\nInformación del Dataset:") 
    print(df.info()) # Muestra tipos de datos y valores no nulos 
    
    print("\nEstadísticas Descriptivas:") 
    print(df.describe()) # Estadísticas numéricas básicas
    
    print("\nValores Nulos por Columna:") 
    print(df.isnull().sum()) # Identifica datos faltantes

In [15]:
def analizar_demograficos(df: pd.DataFrame) -> None: 
    """ Analiza y visualiza la distribución demográfica de los pacientes """ 
    print("\n=== ANÁLISIS DEMOGRÁFICO ===") 
    
    # Distribución por sexo
    print("\nDistribución por Sexo:") 
    print(df['Sex'].value_counts())
    
    # Distribución por edad 
    print("\nEstadísticas de Edad:") 
    print(df['Age'].describe()) 
    
    # Visualización de la distribución de edad 
    plt.figure(figsize=(10, 6)) 
    sns.histplot(data=df, x='Age', bins=30) 
    plt.title('Distribución de Edad de los Pacientes') 
    plt.xlabel('Edad') 
    plt.ylabel('Frecuencia') 
    plt.show()