El código consiste en dos partes principales: la generación de datos aleatorios y la evaluación del riesgo de intervención en la UCI.

Generación de Datos Aleatorios:

Generación de Datos Demográficos: El código genera datos aleatorios para características demográficas como edad, género y condiciones médicas preexistentes.
Generación de Datos Clínicos: Se generan datos aleatorios para indicadores clínicos como la presión arterial, la frecuencia cardíaca, la temperatura corporal, entre otros.
Asignación de Valores de Referencia: Se establecen rangos de valores para cada indicador clínico, basados en datos médicos reales o en criterios establecidos por profesionales de la salud.

los datos que vamos a tratar son: 

| Columna | Descripción |
| --- | --- |
| Edad | La dad del paciente | 
| Etnia | La afiliación étnica o racial del paciente |
| Sexo | El género del paciente, ya sea masculino, femenino u otro. |
| Peso | El peso del paciente (kg) |
| Altura | Altura del paciente (m) |
| IMC | Indice de masa corporal | 
| Antecedentes | Información sobre cualquier condición médica preexistente o historial de enfermedades del paciente |
| Historial familiar | Antecedentes médicos relevantes en la familia del paciente, como enfermedades genéticas o hereditarias |
| Síntomas presentes | Los síntomas específicos que el paciente está experimentando en el momento de la evaluación |
| Riesgos medicación |  Detalles efectos secundarios, interacciones y contraindicaciones |
| Signos vitales Respiratorios | Detalle de los signos vitales medidos del paciente |
| Signos vitales Cardiovasculares | Detalle de los signos vitales medidos en el paciente |
| Resultados de laboratorio | Detalle de los resultados de laboratorio |
| Intervención UCI | El paciente requiere evaluar una intervención UCI o no |


Para los signos vitales, la descripción de los parámetros es la siguiente:

**Signos vitales Respiratorio**

| Signo Vital      | Descripción                                                                                            |
|------------------|--------------------------------------------------------------------------------------------------------|
| FR (Frecuencia Respiratoria) | La frecuencia respiratoria es el número de respiraciones completas que realiza una persona por minuto. Indica la cantidad de veces que el pecho se eleva y desciende en un minuto.                  |
| SpO2 (Saturación de Oxígeno) | La saturación de oxígeno es un indicador de la cantidad de oxígeno transportado en la sangre. Se expresa como un porcentaje y muestra qué tan bien están siendo oxigenados los tejidos del cuerpo.  |
| pH               | El pH arterial es una medida de la acidez o alcalinidad de la sangre. Indica el equilibrio ácido-base en el cuerpo y es crucial para el funcionamiento adecuado de muchas funciones biológicas.          |
| PaO2 (Presión parcial de oxígeno) | La presión parcial de oxígeno es la presión del oxígeno disuelto en la sangre arterial. Es un indicador importante de la capacidad de los pulmones para transferir oxígeno a la sangre.            |


**Signos vitales Cardiovasculares**


| Signo Vital             | Descripción                                                                                                          |
|-------------------------|----------------------------------------------------------------------------------------------------------------------|
| Fc (Frecuencia Cardíaca)| La frecuencia cardíaca es el número de veces que el corazón late en un minuto. Es un indicador de la actividad del corazón y puede variar según la actividad física y el estado emocional.   |
| PA sistólico (Presión Arterial Sistólica)| La presión arterial sistólica es la presión en las arterias cuando el corazón late y bombea sangre hacia el cuerpo. Es el valor más alto registrado durante la medición de la presión arterial.  |
| PAM (Presión Arterial Media) | La presión arterial media es el promedio de la presión en las arterias durante un ciclo completo de latido cardíaco. Se calcula generalmente a partir de la presión sistólica y diastólica y es un indicador de la perfusión tisular.  |


In [1]:
# Librerias necesarias
import pandas as pd
import numpy as np
import random 

In [3]:
def generar_parametro_dis_normal(mean, std):
    """
    Generar un parámetro que siga una distribución normal
    Input: 
        - mean : media de la distribución
        - std : desviación estándar de la distribución
    
    Output: 
        - param : valor aleatorio en la distribución"""
    
    # Generar un valor aleatorio siguiendo una distribución nomalr
    param = np.random.normal(loc=mean, scale=std)
    
    return param


2.553935556938157

In [148]:
import random
import numpy as np

def generar_parametro_dis_normal(media, desviacion):
    """
    Genera un parámetro con una distribución normal.
    """
    return np.random.normal(media, desviacion)

def generar_registro():
    """
    Genera los datos de un paciente.
    
    Output: 
        - Pandas Series object: información de un paciente 
    """
    paciente = {}

    # Información del paciente
    paciente['edad'] = int(generar_parametro_dis_normal(50, 15))  # Edad sigue una distribución normal
    paciente['sexo'] = random.choice(['M', 'F'])  # Sexo aleatorio
    paciente['altura'] = generar_parametro_dis_normal(1.65, 0.10)  # Altura generada
    paciente['peso'] = generar_parametro_dis_normal(70, 10)  # Peso generado
    paciente['imc'] = paciente['peso'] / paciente['altura']**2  # Calcula IMC

    # Información sobre enfermedades
    alteraciones = ['Respiratorio', 'Cardiovascular', 'Renal']
    paciente['antecedentes'] = random.sample(alteraciones, k=random.choice(range(4)))  # Antecedentes aleatorios
    paciente['historia_familiar'] = random.sample(alteraciones, k=random.choice(range(4)))  # Historia familiar aleatoria
    paciente['sintomas'] = random.sample(alteraciones, k=random.choice(range(4)))  # Síntomas aleatorios


    try: 
        paciente['riesgos_med'] = random.sample(paciente['antecedentes'], k=random.choice(range(len(paciente['antecedentes']))))  # Riesgos medicación tomados en cuenta si tiene antecedentes
        if paciente['riesgos_med'] == []:
            paciente['riesgos_med']  = np.nan   
    except: 
        paciente['riesgos_med'] = np.nan

    UCI = False

    # Toma de exámenes
    if 'Respiratorio' in paciente['sintomas']:
        # Signos respiratorios
        paciente['FR'] = random.choice(range(0, 30))
        paciente['SpO2'] = random.choice(range(87, 100))
        paciente['PaCO2'] = random.choice(range(30, 60))
        paciente['pH'] = random.choice(np.linspace(7, 7.8, 10))

        # Condiciones UCI inmediatas según el "Consenso de criterios de ingreso"
        cond = (paciente['FR'] < 8) or (paciente['FR'] > 25) or (paciente['SpO2'] < 92) or (paciente['pH'] < 7.3) or (paciente['PaCO2'] > 50)

        if cond: 
            UCI = True
    
    else:
        paciente['FR'] = np.nan
        paciente['SpO2'] = np.nan
        paciente['PaCO2'] = np.nan
        paciente['pH'] = np.nan
    
    if 'Cardiovascular' in paciente['sintomas']:
        # Signos cardiovasculares
        paciente['FC'] = random.choice(range(60, 101))  # Frecuencia cardíaca en latidos por minuto
        paciente['PAS'] = random.choice(range(90, 141))  # Presión arterial sistólica en mmHg
        paciente['PAM'] = random.choice(range(60, 101))  # Presión arterial media en mmHg

        # Condiciones UCI inmediatas según criterios específicos
        cond = (paciente['FC'] < 40) or (paciente['FC'] > 140) or (paciente['PAS'] < 90) or (paciente['PAS'] > 200) or (paciente['PAM'] < 60) 

        if cond: 
            UCI = True
    else:
        paciente['FC'] = np.nan
        paciente['PAS'] = np.nan
        paciente['PAM'] = np.nan


    if 'Renal' in paciente['sintomas']:
        # Signos renales
        paciente['GFR'] = random.choice(range(0, 121))  # Tasa de Filtración Glomerular en ml/min/1.73m^2

        # Condiciones UCI inmediatas según criterios específicos
        cond = (paciente['GFR'] < 15) 

        if cond: 
            UCI = True

    else:
        paciente['GFR'] = np.nan

    if paciente['antecedentes'] == []:
        paciente['antecedentes']  = np.nan   
    if paciente['historia_familiar'] == []:
            paciente['historia_familiar']  = np.nan   
    if paciente['sintomas'] == []:
            paciente['sintomas']  = np.nan   
    paciente['UCI'] = UCI  # Indica si el paciente debe ser trasladado a UCI
    
    return paciente


Crear registro de pacientes 

In [154]:
# Lista para almacenar los registros de pacientes
registros_pacientes = []

# Generar 1000 registros de pacientes
for _ in range(1000):
    paciente = generar_registro()
    registros_pacientes.append(paciente)

# Convertir la lista de diccionarios en un DataFrame
df_pacientes = pd.DataFrame(registros_pacientes)

# Guardar df
# registros.to_csv(route,  index=False)
df_pacientes.to_csv(r'../data/pacientes.csv')
# Mostrar el DataFrame
df_pacientes.head(5)


Unnamed: 0,edad,sexo,altura,peso,imc,antecedentes,historia_familiar,sintomas,riesgos_med,FR,SpO2,PaCO2,pH,FC,PAS,PAM,GFR,UCI
0,33,F,1.773381,63.064059,20.052937,"[Cardiovascular, Respiratorio]",,"[Renal, Respiratorio, Cardiovascular]",,29.0,93.0,30.0,7.444444,69.0,140.0,84.0,9.0,True
1,53,M,1.654205,59.523289,21.752443,"[Respiratorio, Renal]","[Cardiovascular, Respiratorio, Renal]","[Respiratorio, Renal, Cardiovascular]",[Respiratorio],29.0,96.0,31.0,7.533333,69.0,114.0,83.0,68.0,True
2,70,M,1.574479,71.763955,28.948936,[Renal],"[Respiratorio, Renal, Cardiovascular]",,,,,,,,,,,False
3,31,M,1.59827,70.591755,27.634638,[Cardiovascular],"[Cardiovascular, Renal]",[Cardiovascular],,,,,,90.0,102.0,88.0,,False
4,60,F,1.640255,78.725635,29.261287,,[Cardiovascular],,,,,,,,,,,False
