# Aleatorización Colegios

## Parámetros para los bloques: año y zona 

In [49]:
# Importando las bibliotecas
import pandas as pd
import numpy as np

# Carga del dataset 
df = pd.read_csv('Colegios_Secciones.csv')

# Filtrar las filas donde la columna aleatorización tiene el valor "SI" 
df_filtered = df[(df["Incluido en la aleatorización"] == "SI")]
df_filtered_copy = df_filtered.copy()

In [51]:
def stratified_randomization(data, strata_cols, treatment_col, seed_value=10):
    # Establecer la semilla para reproducibilidad
    np.random.seed(seed_value)
    
    # Inicialización de la columna de tratamiento
    data[treatment_col] = None
    
    # Obtener valores únicos para cada estrato
    unique_strata = data[strata_cols].drop_duplicates()
    
    # Iterar sobre cada combinación única de estratos
    for _, stratum in unique_strata.iterrows():
        mask = (data[strata_cols] == stratum).all(axis=1)
        subset = data[mask]
        
        # Si solo hay una observación en el estrato, asignamos aleatoriamente
        if len(subset) == 1:
            assignments = ["control" if np.random.rand() < 0.5 else "treatment"]
        else:
            n_control = len(subset) // 2
            n_treatment = len(subset) - n_control
            assignments = ["control"] * n_control + ["treatment"] * n_treatment
            np.random.shuffle(assignments)
            
        data.loc[mask, treatment_col] = assignments
        
    return data

# Especificar las columnas de estrato, acá se puede agregar más estratos en el futuro con más casos
strata_columns = ['Zona', 'Año']

# Aplicar la aleatorización por bloques
df_randomized = stratified_randomization(df_filtered_copy, strata_columns, 'assignment')


df_randomized

Unnamed: 0,Nombre de la institución,Sector,Zona,Tipo,Año,Sección,Turno,Número de varones matriculados,Número de mujeres matriculadas,Promedio de edad,Incluido en la aleatorización,assignment
0,COLEGIO NACIONAL DOMINGO ROBLEDO,Público,Urbana,Científico,Primero,A,Tarde,8.0,12.0,15.7,SI,treatment
1,COLEGIO NACIONAL DOMINGO ROBLEDO,Público,Urbana,Científico,Primero,B,Tarde,11.0,15.0,15.77,SI,control
2,COLEGIO NACIONAL DOMINGO ROBLEDO,Público,Urbana,Científico,Segundo,A,Tarde,7.0,8.0,16.53,SI,treatment
3,COLEGIO NACIONAL DOMINGO ROBLEDO,Público,Urbana,Científico,Segundo,B,Mañana,10.0,11.0,16.48,SI,control
6,COLEGIO NACIONAL PADRE RICARDO MUSCH,Público,Urbana,Técnico,Primero,Informática,Mañana-Tarde,13.0,15.0,15.11,SI,treatment
7,COLEGIO NACIONAL PADRE RICARDO MUSCH,Público,Urbana,Técnico,Primero,Contabilidad,Mañana-Tarde,11.0,15.0,16.0,SI,control
8,COLEGIO NACIONAL PADRE RICARDO MUSCH,Público,Urbana,Técnico,Segundo,Informática,Mañana,13.0,11.0,16.21,SI,control
9,COLEGIO NACIONAL PADRE RICARDO MUSCH,Público,Urbana,Técnico,Segundo,Contabilidad,Mañana-Tarde,6.0,13.0,16.21,SI,treatment
12,COLEGIO NACIONAL PUERTO TRIUNFO,Público,Rural,Científico,Primero,A,Mañana,8.0,15.0,15.43,SI,control
13,COLEGIO NACIONAL PUERTO TRIUNFO,Público,Rural,Científico,Segundo,A,Mañana,15.0,11.0,16.27,SI,treatment
