In [7]:
# Importaciones principales
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import networkx as nx
import scipy.stats as stats
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA

In [11]:
# Generación de datos sintéticos
def generar_datos_ensayo_clinico(n_muestras=500):
    np.random.seed(42)

    # Variables
    grupo = np.random.choice(['Intervencion', 'Control'], n_muestras)
    dosis = np.where(grupo == 'Intervencion',
                    np.random.uniform(50, 200, n_muestras),
                    np.zeros(n_muestras))
    # Marcadores biológicos simulados
    marcador_base = np.random.normal(100, 20, n_muestras)
    marcador_final = np.where(
        grupo == 'Intervencion',
        marcador_base * (1 - np.random.uniform(0.1, 0.3, n_muestras)),
        marcador_base
    )

    
    # efectos secundarios
    efectos_secundarios = np.random.binomial(1,
                                             np.where(grupo == 'Intervencion', 0.2, 0.05),
                                             n_muestras)
    tiempo_recuperacion = np.random.normal(np.where(grupo == 'Intervencion', 14, 21),
                                          3,
                                          n_muestras)

    df = pd.DataFrame({
        'ID' : range(1, n_muestras + 1),
        'Grupo' : grupo,
        'Dosis' : dosis,
        'Marcador_inicial' : marcador_base,
        'Marcador_final' : marcador_final,
        'Efectos_secundarios' : efectos_secundarios,
        'Tiempo_recuperacion' : tiempo_recuperacion
    })

    return df

# Generar los datos
datos_ensayo = generar_datos_ensayo_clinico()


# Analisis ensayo
def analisis_ensayo_clinico(df):
    # Analisis comparativo de grupos
    comparacion_grupos = df.groupby('Grupo').agg({
        'Marcador_inicial' : 'mean',
        'Marcador_final' : 'mean',
        'Efectos_secundarios' : 'mean',
        'Tiempo_recuperacion' : 'mean'
    })

    print('Comparación de grupos')
    print(comparacion_grupos)

# Ejecutar analisis
analisis_ensayo_clinico(datos_ensayo)

Comparación de grupos
              Marcador_inicial  Marcador_final  Efectos_secundarios  \
Grupo                                                                 
Control             100.975091      100.975091             0.039062   
Intervencion        102.170947       81.382710             0.213115   

              Tiempo_recuperacion  
Grupo                              
Control                 20.851321  
Intervencion            14.203042  
