In [23]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from typing import Dict
import numpy as np


In [24]:
def cargar_datos(datos_biosanitarios_sinteticos: str) -> pd.DataFrame:
    """ Carga los datos desde un archivo CSV y maneja posibles errores """
    try:
        df = pd.read_csv(datos_biosanitarios_sinteticos)
        print("Datos cargados exitosamente")
        return df
    except Exception as e:
        print(f"Error al cargar los datos: {e}")
        return None
    
    


In [25]:
def realizar_analisis_exploratorio(df: pd.DataFrame) -> None: 
    """ Realiza y muestra un análisis exploratorio básico del dataset """ 
    print("\n=== ANÁLISIS EXPLORATORIO INICIAL ===") 
    
    print("\nInformación del Dataset:") 
    print(df.info()) # Muestra tipos de datos y valores no nulos 
    
    print("\nEstadísticas Descriptivas:") 
    print(df.describe()) # Estadísticas numéricas básicas
    
    print("\nValores Nulos por Columna:") 
    print(df.isnull().sum()) # Identifica datos faltantes

In [26]:
def analizar_demograficos(df: pd.DataFrame) -> None: 
    """ Analiza y visualiza la distribución demográfica de los pacientes """ 
    print("\n=== ANÁLISIS DEMOGRÁFICO ===") 
    
    # Distribución por sexo
    print("\nDistribución por Sexo:") 
    print(df['Sex'].value_counts())
    
    # Distribución por edad 
    print("\nEstadísticas de Edad:") 
    print(df['Age'].describe()) 
    
    # Visualización de la distribución de edad 
    plt.figure(figsize=(10, 6)) 
    sns.histplot(data=df, x='Age', bins=30) 
    plt.title('Distribución de Edad de los Pacientes') 
    plt.xlabel('Edad') 
    plt.ylabel('Frecuencia') 
    plt.show()

In [None]:
def analizar_condiciones_clinicas(df: pd.DataFrame) -> None: 
   
    """ Analiza la prevalencia de síntomas y marcadores bioquímicos """ 
    print("\n=== ANÁLISIS DE CONDICIONES CLÍNICAS ===") 
    
    # Análisis de síntomas 
    sintomas = ['Ascites', 'Hepatomegaly', 'Spiders', 'Edema'] 
    for sintoma in sintomas: 
        print(f"\nDistribución de {sintoma}:") 
        print(df[sintoma].value_counts()) 
        
    # Análisis de marcadores bioquímicos 
    marcadores = ['Bilirubin', 'Cholesterol', 'Albumin', 'Copper', 'Alk_Phos', 'SGOT'] 
    print("\nEstadísticas de Marcadores Bioquímicos:")
    print(df[marcadores].describe())

In [28]:
def analizar_tratamientos(df: pd.DataFrame) -> None: 
    
    """ Analiza los tratamientos aplicados y sus resultados """ 
    print("\n=== ANÁLISIS DE TRATAMIENTOS Y RESULTADOS ===") 
    
    # Distribución de medicamentos 
    print("\nDistribución de Medicamentos:") 
    print(df['Drug'].value_counts()) 
    
    # Análisis de estado (Status) 
    print("\nDistribución de Estado:") 
    print(df['Status'].value_counts()) 
    
    # Análisis por etapa 
    print("\nDistribución por Etapa:") 
    print(df['Stage'].value_counts())

In [29]:
def crear_visualizaciones(df: pd.DataFrame) -> None: 
    """ Crea visualizaciones avanzadas para análisis detallado """
    
    # Matriz de correlación
    variables_numericas = ['Age', 'Bilirubin', 'Cholesterol',
                           'Albumin', 'Copper', 'Alk_Phos', 'SGOT', 
                           'Tryglicerides', 'Platelets', 'Prothrombin'] 
    plt.figure(figsize=(12, 8)) 
    sns.heatmap(df[variables_numericas].corr(), annot=True, cmap='coolwarm', center=0) 
    plt.title('Matriz de Correlación de Variables Numéricas') 
    plt.xticks(rotation=45) 
    plt.yticks(rotation=45) 
    plt.tight_layout()
    plt.show()
    
    # Distribución de etapas por medicamento 
    plt.figure(figsize=(10, 6)) 
    sns.boxplot(data=df, x='Drug', y='Stage') 
    plt.title('Distribución de Etapas por Medicamento') 
    plt.xticks(rotation=45) 
    plt.tight_layout() 
    plt.show()

In [31]:
def main(): 
    #Cargar los datos 
    df = cargar_datos('datos_biosanitarios_sinteticos') 
    
    if df is not None: 
        realizar_analisis_exploratorio(df) 
        analizar_demograficos(df) 
        analizar_condiciones_clinicas(df) 
        analizar_tratamientos(df) 
        crear_visualizaciones(df) 

if __name__ == "__main__": 
    main()

Error al cargar los datos: [Errno 2] No such file or directory: 'datos_biosanitarios_sinteticos'
