## üîó Montar Google Drive para acceder a archivos del Scheduling Problem

Este bloque conecta Google Colab con Google Drive. Es necesario para poder cargar o guardar archivos relacionados con el algoritmo gen√©tico aplicado al problema de generaci√≥n de horarios escolares. Asegura acceso a datos como los cromosomas iniciales, los logs de evoluci√≥n, y los archivos con los mejores individuos encontrados.


In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## üìÇ Cargar datasets del Scheduling Problem desde Google Drive

Este bloque carga los datasets principales que definen las condiciones del problema de generaci√≥n de horarios:

- `docentes.csv`: contiene los profesores y las materias que dictan.
- `materias.csv`: define cada materia con su respectivo nivel y carga horaria.
- `paralelos.csv`: lista los cursos y aulas por cada nivel educativo.
- `horarios.csv`: define los rangos de tiempo disponibles para la asignaci√≥n.

Estos datos son fundamentales para la construcci√≥n de cromosomas v√°lidos y la evaluaci√≥n del fitness en cada generaci√≥n del algoritmo gen√©tico.


In [None]:
import pandas as pd
import random

ruta = '/content/drive/MyDrive/Tesis_MSDS'
# Cargar los datos
docentes = pd.read_csv(ruta+"/docentes.csv")
materias = pd.read_csv(ruta+"/materias.csv")
paralelos = pd.read_csv(ruta+"/paralelos.csv")
horarios = pd.read_csv(ruta+"/horarios.csv")

## üßπ Preprocesamiento: Unificaci√≥n de docentes por asignatura especializada

Este bloque aplica reglas de unificaci√≥n de nombres de docentes para ciertas materias espec√≠ficas, con el objetivo de mantener consistencia en la asignaci√≥n horaria durante el proceso evolutivo:

- **Ingl√©s desde 7mo EGB en adelante**: Se consolidan los docentes `DAISY HERRERA`, `ELIZABETH PUGA` y `SIMONE AYALA` bajo el identificador com√∫n `INGLES ESPECIAL`.
- **Educaci√≥n F√≠sica desde 3ro EGB**: Se unifican `NANCY LINCANGO`, `CARLOS MORALES` e `IV√ÅN MALDONADO` como `EF ESPECIAL`.

Esta estandarizaci√≥n permite asegurar que estas materias sean asignadas de forma sincronizada entre paralelos del mismo nivel durante la construcci√≥n de cromosomas y aplicaci√≥n de restricciones duras.


In [None]:
#Unificar docentes de ingl√©s a partir de 7mo EGB
docentes=docentes.drop(docentes[docentes['Nombres']=='ELIZABETH PUGA'].index)
docentes=docentes.drop(docentes[docentes['Nombres']=='SIMONE AYALA'].index)
docentes["Nombres"] = docentes["Nombres"].replace("DAISY HERRERA", "INGLES ESPECIAL")

#Unificar docentes de Educaci√≥n F√≠sica a partir de 3ro EGB
docentes=docentes.drop(docentes[docentes['Nombres']=='CARLOS MORALES'].index)
docentes=docentes.drop(docentes[docentes['Nombres']=='IV√ÅN MALDONADO'].index)
docentes["Nombres"] = docentes["Nombres"].replace("NANCY LINCANGO", "EF ESPECIAL")

docentes.reset_index()

## üßæ Normalizaci√≥n de c√≥digos de asignaturas por docente

Este bloque transforma la columna `Codigo` del dataset de docentes, que originalmente contiene conjuntos de c√≥digos como strings (`{'MAT_3EGB', 'LEN_3EGB'}`), en un formato plano y legible para el modelo gen√©tico.

### Transformaciones aplicadas:
- üîç **Limpieza**: Se eliminan caracteres como `{}`, comillas simples y espacios extra.
- üîÑ **Explosi√≥n de filas**: Cada c√≥digo de materia impartido por un docente pasa a una fila separada.

Esto es esencial para permitir una asignaci√≥n precisa durante la generaci√≥n y evaluaci√≥n de cromosomas, ya que cada c√≥digo representa una materia que debe ser distribuida en el horario.


In [None]:
df=docentes.copy()
# Limpiar la columna 'Codigo': eliminar llaves y comillas simples
df["Codigo"] = df["Codigo"].str.replace(r"[{}']", "", regex=True)

# Separar los c√≥digos por coma y expandir en filas individuales
docentes = df.assign(Codigo=df["Codigo"].str.split(", ")).explode("Codigo")

docentes.head(5)

Unnamed: 0,index,Nombres,Cargo,Materia,Codigo
0,0,MALENA O√ëA,Tiempo completo,LENGUAJE,LEN_1EGB
1,1,ALISON PLAZA,Tiempo completo,LECTORES,LEC_1EGB
1,1,ALISON PLAZA,Tiempo completo,LECTORES,LEC_2EGB
1,1,ALISON PLAZA,Tiempo completo,LECTORES,LEC_3EGB
2,2,SOF√çA Y√âPEZ,Tiempo completo,LENGUAJE,LEN_3EGB
2,2,SOF√çA Y√âPEZ,Tiempo completo,LENGUAJE,LEN_2EGB
3,3,ROSITA ALBUJA,Tiempo completo,LENGUAJE,LEN_5EGB
3,3,ROSITA ALBUJA,Tiempo completo,LENGUAJE,LEN_4EGB
4,4,NARCISA MU√ëOZ,Tiempo completo,LENGUAJE,LEN_6EGB
4,4,NARCISA MU√ëOZ,Tiempo completo,LENGUAJE,LEN_7EGB


## üß† Construcci√≥n de diccionario profesor ‚Üî c√≥digo de materia

Este bloque crea un diccionario que asocia directamente cada c√≥digo de materia con el nombre del docente correspondiente.

### Objetivo:
Permitir una consulta eficiente del docente responsable de una materia espec√≠fica, lo cual es clave para:
- Asignar correctamente los docentes al construir cada cromosoma.
- Aplicar restricciones como la no duplicaci√≥n de docentes en simult√°neo.

### Transformaciones aplicadas:
- Limpieza de strings tipo `{‚ÄòLEN_3EGB‚Äô, ‚ÄòLEN_2EGB‚Äô}` para extraer c√≥digos individuales.
- Creaci√≥n del diccionario `dic_profesores` en formato:  
  ```python
  {'LEN_3EGB': 'MALENA O√ëA', 'EST_10EGB': 'SANTIAGO CALLE', ...}


In [None]:
import pandas as pd
df=docentes.copy()
# Carga del archivo CSV
df = docentes

# Identifica las columnas
col_codigo = 'Codigo'
col_profesor = 'Nombres'

# Diccionario resultado
dic_profesores = {}

for _, row in df.iterrows():
    raw = row[col_codigo]
    if pd.isna(raw):
        continue

    # Convertimos a cadena y eliminamos espacios exteriores
    s = str(raw).strip()

    # Si empieza por '{' o '[' acabamos quitando delimitadores
    if s.startswith('{') and s.endswith('}'):
        # Quitamos las llaves
        s = s[1:-1]
    elif s.startswith('[') and s.endswith(']'):
        # Quitamos los corchetes
        s = s[1:-1]

    # Ahora s es algo como "'LEC_1EGB', 'LEC_3EGB', 'LEC_2EGB'"
    # Partimos por comas y limpiamos comillas
    codes = []
    for part in s.split(','):
        part = part.strip().strip("'\"")  # quita comillas simples o dobles
        if part:
            codes.append(part)

    # Asociamos cada c√≥digo con el profesor
    for code in codes:
        dic_profesores[code] = row[col_profesor]

# Ejemplo de uso:
for ejemplo in ['LEN_3EGB', 'PEN_10EGB', 'EST_10EGB']:
    prof = dic_profesores.get(ejemplo, 'No encontrado')
    print(f"Profesor de {ejemplo}: {prof}")

Profesor de LEN_3EGB: SOF√çA Y√âPEZ
Profesor de PEN_10EGB: MIREYA BRITO
Profesor de EST_10EGB: JONATHAN CASTRO


In [None]:
dic_profesores['LEN_1EGB']

'MALENA O√ëA'

## üìÖ Definici√≥n de par√°metros y restricciones de horario

Este bloque define las funciones auxiliares y restricciones necesarias para construir cromosomas v√°lidos, tomando en cuenta reglas propias del calendario escolar del colegio.

### Componentes definidos:

- `dias_semana`: Lista base de d√≠as laborables.
- `obtener_materias_por_nivel(nivel)`: Devuelve la lista de c√≥digos de materia correspondientes a un nivel educativo espec√≠fico (por ejemplo, 8EGB).
- `obtener_docente_por_materia_codigo(codigo)`: Consulta el docente responsable de un c√≥digo de materia usando el diccionario `dic_profesores`.
- `es_horario_valido(nivel, dia, hora)`: Verifica si un horario espec√≠fico es v√°lido para un determinado nivel. Esta funci√≥n incorpora:
  - Restricciones por **receso** y **almuerzo**.
  - Bloqueos por eventos institucionales como **Evalev** y **Clubs extracurriculares**.
  - Diferenciaci√≥n por nivel educativo y d√≠a de la semana.

Estas validaciones son fundamentales para asegurar que las asignaciones generadas durante el algoritmo evolutivo cumplan con las restricciones duras del problema de Scheduling.

In [None]:
# Lista de d√≠as de la semana
dias_semana = ["Lunes", "Martes", "Mi√©rcoles", "Jueves", "Viernes"]

# Filtrar materias seg√∫n nivel
def obtener_materias_por_nivel(nivel):
    return materias[materias["Nivel"] == nivel]["C√≥digo"].tolist()

# Obtener docente que imparte la materia
def obtener_docente_por_materia_codigo(codigo_materia):
    return dic_profesores.get(codigo_materia, None)

def es_horario_valido(nivel, dia, hora):
    # Receso
    if nivel in ["1EGB", "2EGB", "3EGB"] and hora == 5:
        return False
    if nivel not in ["1EGB", "2EGB", "3EGB"] and hora == 6:
        return False

    # Almuerzo
    if nivel in ["1EGB", "2EGB", "3EGB", "4EGB", "5EGB", "6EGB", "7EGB"] and hora in [11, 12]:
        return False
    if nivel in ["8EGB", "9EGB", "10EGB", "1BGU", "2BGU", "3BGU"] and hora in [13, 14]:
        return False

    # Evalev
    if dia == "Mi√©rcoles" and hora in [1, 2]:
        return False

    # Clubs
    if nivel == "1EGB" and ((dia == "Lunes" and hora in [15, 16]) or (dia == "Jueves" and hora in [13, 14])):
        return False
    if nivel in ["2EGB", "3EGB", "4EGB", "5EGB", "6EGB", "7EGB"] and dia in ["Martes", "Jueves"] and hora in [15, 16]:
        return False
    if nivel in ["8EGB", "9EGB", "10EGB", "1BGU", "2BGU", "3BGU"] and dia in ["Mi√©rcoles", "Viernes"] and hora in [15, 16]:
        return False

    return True


## üßÆ Funci√≥n de ordenamiento de cromosomas por nivel, aula, d√≠a y hora

Esta funci√≥n organiza los genes de un cromosoma en un orden l√≥gico y jer√°rquico para facilitar su an√°lisis, visualizaci√≥n y depuraci√≥n.

### Criterios de ordenamiento aplicados:
1. **Nivel educativo** en el orden oficial: de 1EGB hasta 3BGU.
2. **Paralelo** en orden alfab√©tico.
3. **D√≠a de la semana**: de lunes a viernes.
4. **Hora**: en orden creciente (desde la primera hora del d√≠a).

Esto garantiza que el cromosoma tenga una estructura consistente a lo largo del proceso evolutivo, lo cual es √∫til tanto para el monitoreo como para asegurar una correcta interpretaci√≥n por parte de los operadores gen√©ticos.

> üí° Esta funci√≥n no altera el contenido del cromosoma, solo su orden para facilitar operaciones posteriores.


In [None]:
def ordenar_cromosoma(cromosoma):
    """
    Ordena la lista de genes por:
      1) Nivel, en el orden 1EGB‚Üí2EGB‚Üí‚Ä¶‚Üí10EGB‚Üí1BGU‚Üí2BGU‚Üí3BGU
      2) Paralelo (alfab√©ticamente)
      3) D√≠a de la semana (Lunes‚ÜíViernes)
      4) Hora (ascendente)
    """
    # 1) Definir orden expl√≠cito de niveles
    niveles_orden = [
        "1EGB","2EGB","3EGB","4EGB","5EGB","6EGB","7EGB",
        "8EGB","9EGB","10EGB",
        "1BGU","2BGU","3BGU"
    ]
    idx_nivel = {niv: i for i, niv in enumerate(niveles_orden)}

    # 2) Orden de d√≠as
    dias_orden = {dia: i for i, dia in enumerate(["Lunes","Martes","Mi√©rcoles","Jueves","Viernes"])}

    # 3) Sort usando key m√∫ltiple
    cromosoma_ordenado = sorted(
        cromosoma,
        key=lambda gen: (
            idx_nivel.get(gen[0], 999),  # Nivel (por si hay alguno inesperado)
            gen[1],                       # Paralelo
            dias_orden[gen[2]],           # D√≠a seg√∫n dias_orden
            gen[3]                        # Hora
        )
    )
    return cromosoma_ordenado


## ‚è∞ Asignaci√≥n sincronizada de materias en m√∫ltiples aulas por nivel

Esta funci√≥n permite asignar una misma materia (`codigo_materia`) a m√∫ltiples aulas simult√°neamente dentro de uno o m√°s niveles educativos. Se asegura de que todas las asignaciones compartan el mismo d√≠a y hora, respetando las restricciones del modelo.

### Par√°metros:
- `cromosoma`: lista actual de genes a modificar.
- `niveles_target`: niveles educativos involucrados en la sincronizaci√≥n (por ejemplo, `["7EGB", "8EGB", "9EGB"]`).
- `codigo_materia`: c√≥digo √∫nico de la materia a asignar (por ejemplo, `"ING_7EGB"`).
- `cantidad_horas`: n√∫mero total de bloques a asignar para esta materia.
- `en_parejas`: si `True`, se asignan **bloques dobles continuos** (por ejemplo, para materias con sesiones extendidas).

### Caracter√≠sticas clave:
- Utiliza `es_horario_valido` para verificar que los bloques est√©n disponibles y no caigan en recesos, almuerzos o eventos institucionales.
- Aplica verificaci√≥n cruzada para evitar colisiones de horario en todas las aulas y niveles involucrados.
- El resultado es un cromosoma actualizado con las nuevas asignaciones sincronizadas.

Esta funci√≥n es fundamental para materias como **Ingl√©s Especial** o **Educaci√≥n F√≠sica**, que deben dictarse en paralelo entre varias aulas del mismo nivel.


In [None]:
def asignar_misma_hora_multiple_aulas_actualizado(cromosoma, niveles_target, codigo_materia, cantidad_horas, en_parejas=False):
    aulas_por_nivel = {
        nivel: paralelos.loc[paralelos["Nivel"] == nivel, "Nombre_paralelo"].tolist()
        for nivel in niveles_target
    }

    posibles_slots = []
    for dia in dias_semana:
        for h in range(1, 17 if not en_parejas else 16):
            if en_parejas and not all(es_horario_valido(n, dia, h) and es_horario_valido(n, dia, h+1) for n in niveles_target):
                continue
            if not en_parejas and not all(es_horario_valido(n, dia, h) for n in niveles_target):
                continue
            posibles_slots.append((dia, h))

    random.shuffle(posibles_slots)
    horas_asignadas = 0

    for dia, hora in posibles_slots:
        ocupado = False
        for nivel in niveles_target:
            for aula in aulas_por_nivel[nivel]:
                if any((g[0] == nivel and g[1] == aula and g[2] == dia and g[3] == hora) or
                       (en_parejas and g[0] == nivel and g[1] == aula and g[2] == dia and g[3] == hora+1)
                       for g in cromosoma):
                    ocupado = True
                    break
        if ocupado:
            continue

        for nivel in niveles_target:
            for aula in aulas_por_nivel[nivel]:
                docente = obtener_docente_por_materia_codigo(codigo_materia)
                cromosoma.append((nivel, aula, dia, hora, codigo_materia, docente))
                if en_parejas:
                    cromosoma.append((nivel, aula, dia, hora+1, codigo_materia, docente))

        horas_asignadas += 2 if en_parejas else 1
        if horas_asignadas >= cantidad_horas:
            break

    return cromosoma



## üß¨ Generaci√≥n de cromosoma inicial con bloques sincronizados y asignaciones estructuradas

Esta funci√≥n construye un cromosoma v√°lido para el problema de Scheduling Educativo. Cada cromosoma representa un horario completo con todas las asignaciones posibles de materias, aulas, d√≠as y docentes, cumpliendo con restricciones duras como horarios v√°lidos y franjas especiales por nivel.

### Fases principales de la generaci√≥n:

#### 1Ô∏è‚É£ **Asignaciones especiales sincronizadas por nivel**
- Materias como **INGLES ESPECIAL**, **ESTUDIOS SOCIALES**, **DESARROLLO PERSONAL** o **CIUDADAN√çA** se asignan en bloques comunes para todas las aulas de un mismo nivel, usando la funci√≥n `asignar_misma_hora_multiple_aulas_actualizado`.

#### 2Ô∏è‚É£ **Asignaci√≥n por pares preferidos**
- Se crean bloques de clases en pares, respetando combinaciones pedag√≥gicas predefinidas como:
  - `DER` ‚Üî `COM`
  - `SPE` ‚Üî `INV`
  - `SAL` ‚Üî `ECO`
  - `EXP` ‚Üî `RAZ` / `CAL`
  - `DAN` ‚Üî `MUS`
- Estos pares se asignan en bloques contiguos (slots dobles) en d√≠as y horas v√°lidas.

#### 3Ô∏è‚É£ **Relleno de ranuras restantes**
- Se llena el resto del horario con las materias disponibles seg√∫n la carga horaria restante, validando siempre:
  - Que el horario sea v√°lido (`es_horario_valido`)
  - Que no exista una asignaci√≥n previa en el mismo bloque

#### 4Ô∏è‚É£ **Orden final**
- El cromosoma generado se ordena al final por nivel, paralelo, d√≠a y hora para mantener consistencia y facilitar el an√°lisis visual y evolutivo.

> ‚ö†Ô∏è Cada cromosoma generado es diferente, ya que intervienen decisiones aleatorias (`random.shuffle`, `random.choice`) tanto en la selecci√≥n de materias como en la ubicaci√≥n de horarios, lo que aporta diversidad gen√©tica inicial a la poblaci√≥n.


In [None]:
import random

def generar_cromosoma():
    cromosoma = []
    niveles = paralelos["Nivel"].unique()

    # 1. Asignaciones comunes por nivel
    niveles_ingles = ["7EGB", "8EGB", "9EGB", "10EGB", "1BGU", "2BGU", "3BGU"]
    for nivel in niveles_ingles:
        cod = f"ING_{nivel}"
        cromosoma = asignar_misma_hora_multiple_aulas_actualizado(cromosoma, [nivel], cod, cantidad_horas=6, en_parejas=True)

    cromosoma = asignar_misma_hora_multiple_aulas_actualizado(cromosoma, ["3BGU"], "EST_3BGU", cantidad_horas=2, en_parejas=True)
    cromosoma = asignar_misma_hora_multiple_aulas_actualizado(cromosoma, ["3BGU"], "DES_3BGU", cantidad_horas=2, en_parejas=True)
    cromosoma = asignar_misma_hora_multiple_aulas_actualizado(cromosoma, ["1BGU"], "CIU_1BGU", cantidad_horas=1, en_parejas=False)
    cromosoma = asignar_misma_hora_multiple_aulas_actualizado(cromosoma, ["2BGU"], "CIU_2BGU", cantidad_horas=1, en_parejas=False)

    # 2. Pares preferidos
    pares_pref = {
        "DER": "COM",
        "SPE": "INV",
        "SAL": "ECO",
        "EXP": ["RAZ", "CAL"],
        "DAN": "MUS"
    }

    for nivel in niveles:
        aulas = paralelos.loc[paralelos["Nivel"] == nivel, "Nombre_paralelo"]
        materias_nivel = materias[materias["Nivel"] == nivel]

        for aula in aulas:
            bolsa = []
            for _, row in materias_nivel.iterrows():
                bolsa += [row["C√≥digo"]] * int(row["Horas"])

            bolsa = [c for c in bolsa if not any(g[0] == nivel and g[1] == aula and g[4] == c for g in cromosoma)]

            # Buscar ranuras dobles disponibles
            slots_pares = []
            for dia in dias_semana:
                horas_validas = sorted(h for h in range(1, 16)
                    if es_horario_valido(nivel, dia, h)
                    and es_horario_valido(nivel, dia, h+1)
                    and not any(g[0] == nivel and g[1] == aula and g[2] == dia and g[3] in [h, h+1] for g in cromosoma))
                for h in horas_validas:
                    if h + 1 in horas_validas:
                        slots_pares.append((dia, h))

            lista_pares = []
            claves = list(pares_pref.keys())
            random.shuffle(claves)
            for pref in claves:
                pareja = pares_pref[pref]
                cods1 = [c for c in bolsa if c.startswith(pref)]
                if isinstance(pareja, list):
                    cods2 = [c for c in bolsa if any(c.startswith(p) for p in pareja)]
                else:
                    cods2 = [c for c in bolsa if c.startswith(pareja)]
                num = min(len(cods1), len(cods2))

                for _ in range(num):
                    c1 = cods1.pop(); bolsa.remove(c1)
                    if isinstance(pareja, list):
                        c2 = next(c for c in cods2 if any(c.startswith(p) for p in pareja))
                        cods2.remove(c2)
                    else:
                        c2 = cods2.pop()
                    bolsa.remove(c2)

                    # üîÅ Orden aleatorio de la pareja
                    pareja_ordenada = [c1, c2]
                    random.shuffle(pareja_ordenada)
                    lista_pares.append(tuple(pareja_ordenada))


            random.shuffle(lista_pares)
            random.shuffle(slots_pares)
            for (dia, h), (c1, c2) in zip(slots_pares, lista_pares):
                d1 = obtener_docente_por_materia_codigo(c1)
                d2 = obtener_docente_por_materia_codigo(c2)
                cromosoma.append((nivel, aula, dia, h, c1, d1))
                cromosoma.append((nivel, aula, dia, h+1, c2, d2))

            # 3. Relleno final
            for dia in dias_semana:
                for hora in range(1, 17):
                    if not es_horario_valido(nivel, dia, hora):
                        continue
                    if any(g[0] == nivel and g[1] == aula and g[2] == dia and g[3] == hora for g in cromosoma):
                        continue
                    if bolsa:
                        idx = random.randrange(len(bolsa))
                        c = bolsa.pop(idx)
                        d = obtener_docente_por_materia_codigo(c)
                        cromosoma.append((nivel, aula, dia, hora, c, d))

    return ordenar_cromosoma(cromosoma)


In [None]:
# Generar cromosoma y mostrar validaci√≥n
cromosoma_ejemplo = generar_cromosoma()
print(f"Total de genes generados: {len(cromosoma_ejemplo)}")

# Mostrar los primeros 5 genes
for gen in cromosoma_ejemplo[:]:
    print(gen)

Total de genes generados: 2832
('1EGB', 'Ejemplares', 'Lunes', 1, 'EST_1EGB', 'SANTIAGO CALLE')
('1EGB', 'Ejemplares', 'Lunes', 2, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 3, 'LEC_1EGB', 'ALISON PLAZA')
('1EGB', 'Ejemplares', 'Lunes', 4, 'EST_1EGB', 'SANTIAGO CALLE')
('1EGB', 'Ejemplares', 'Lunes', 6, 'INV_1EGB', 'KARLA LAZCANO')
('1EGB', 'Ejemplares', 'Lunes', 7, 'SPE_1EGB', 'CHRISTIAN SOLANO')
('1EGB', 'Ejemplares', 'Lunes', 7, 'SAL_1EGB', 'VANESSA ESP√çN')
('1EGB', 'Ejemplares', 'Lunes', 8, 'ECO_1EGB', 'MARJURIE J√ÅCOME')
('1EGB', 'Ejemplares', 'Lunes', 9, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Lunes', 10, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Lunes', 13, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Lunes', 14, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Martes', 1, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Martes', 2, 'NAT_1EGB', 'MARIANA HIDALGO')
('1EGB', 'Ejemplares', 'Martes', 3, 'ING_1EGB', 'MARCI

## üìä Conteo de asignaciones por aula dentro de un cromosoma

Esta funci√≥n permite auditar cu√°ntas asignaciones horarias tiene cada aula en un cromosoma generado. Se utiliza para verificar el equilibrio en la distribuci√≥n de bloques por paralelo y nivel.

### ¬øQu√© hace exactamente?
- Recorre todos los genes del cromosoma.
- Agrupa por `(Nivel, Aula)`.
- Devuelve un `Counter` con el n√∫mero total de asignaciones por aula.

### Aplicaciones:
- Validar si las aulas est√°n cumpliendo con la carga horaria total.
- Detectar asignaciones insuficientes o excesivas por curso.
- Monitorear la convergencia estructural del algoritmo evolutivo.

> üí° Esta funci√≥n es √∫til tanto para diagn√≥sticos en la poblaci√≥n inicial como para evaluar consistencia al final del proceso evolutivo.


In [None]:
from collections import Counter

def contar_asignaciones_por_aula(cromosoma):
    """
    Devuelve un Counter cuyas claves son tuplas (Nivel, Aula)
    y los valores el n√∫mero de genes asignados a esa aula.
    """
    contador = Counter((nivel, aula) for nivel, aula, *_ in cromosoma)
    return contador

# Uso:
ctr = contar_asignaciones_por_aula(cromosoma_ejemplo)
for (nivel, aula), num_genes in ctr.items():
    print(f"{nivel} ‚Ä¢ {aula}: {num_genes}")


1EGB ‚Ä¢ Ejemplares: 59
1EGB ‚Ä¢ Entusiastas: 59
1EGB ‚Ä¢ Estudiosos: 59
1EGB ‚Ä¢ Exitosos: 59
2EGB ‚Ä¢ Afectuosos: 59
2EGB ‚Ä¢ Amables: 59
2EGB ‚Ä¢ Amigables: 59
2EGB ‚Ä¢ Amistosos: 59
3EGB ‚Ä¢ Colaboradores: 59
3EGB ‚Ä¢ Conciliadores: 59
3EGB ‚Ä¢ Cordiales: 59
3EGB ‚Ä¢ Creativos: 59
4EGB ‚Ä¢ Optimistas: 59
4EGB ‚Ä¢ Ordenados: 59
4EGB ‚Ä¢ Organizados: 59
4EGB ‚Ä¢ Originales: 59
5EGB ‚Ä¢ Admirables: 59
5EGB ‚Ä¢ Afectivos: 59
5EGB ‚Ä¢ Aplicados: 59
5EGB ‚Ä¢ Atentos: 59
6EGB ‚Ä¢ Ecu√°nimes: 59
6EGB ‚Ä¢ Emprendedores: 59
6EGB ‚Ä¢ Excelentes: 59
6EGB ‚Ä¢ Expresivos: 59
7EGB ‚Ä¢ Reflexivos: 59
7EGB ‚Ä¢ Resilientes: 59
7EGB ‚Ä¢ Respetuosos: 59
7EGB ‚Ä¢ Responsables: 59
8EGB ‚Ä¢ Decididos: 59
8EGB ‚Ä¢ Diligentes: 59
8EGB ‚Ä¢ Din√°micos: 59
8EGB ‚Ä¢ Disciplinados: 59
9EGB ‚Ä¢ Altruistas: 59
9EGB ‚Ä¢ Asertivos: 59
9EGB ‚Ä¢ Audaces: 59
9EGB ‚Ä¢ Aut√©nticos: 59
10EGB ‚Ä¢ Pacifistas: 59
10EGB ‚Ä¢ Perspicaces: 59
10EGB ‚Ä¢ Positivos: 59
1BGU ‚Ä¢ Confiables: 59
1BGU ‚Ä¢ Integros: 59
1BGU ‚Ä¢ Leales:

## üßæ Conteo de horas asignadas por materia en cada aula

Esta funci√≥n convierte un cromosoma en una tabla estructurada que muestra cu√°ntas horas ha sido asignada cada materia en cada paralelo.

### Funcionalidad:
- Transforma el cromosoma (lista de tuplas) en un `DataFrame`.
- Agrupa por `(Nivel, Aula, C√≥digo_materia)` para contar cu√°ntas veces aparece cada materia.
- Devuelve un `DataFrame` ordenado que permite comparar lo asignado con lo esperado.

### Aplicaciones:
- Verificar si las materias cumplen con su carga horaria oficial.
- Identificar desbalances o errores de asignaci√≥n por curso.
- Monitorear la coherencia interna de cromosomas generados por el algoritmo evolutivo.

> ‚úÖ Este resumen es especialmente √∫til al final de la evoluci√≥n para validar la factibilidad de los horarios generados.


In [None]:
import pandas as pd

def contar_horas_por_materia(cromosoma):
    """
    Recibe:
        cromosoma: lista de tuplas
           (Nivel, Aula, D√≠a, Hora, C√≥digo_materia, Docente)
    Devuelve un DataFrame con el n√∫mero de horas asignadas por materia en cada aula.
    """
    # 1) Convertir la lista de genes en un DataFrame
    df = pd.DataFrame(
        cromosoma,
        columns=["Nivel", "Aula", "D√≠a", "Hora", "C√≥digo_materia", "Docente"]
    )

    # 2) Agrupar por Nivel, Aula y C√≥digo_materia, y contar ocurrencias (horas)
    resumen = (
        df
        .groupby(["Nivel", "Aula", "C√≥digo_materia"])
        .size()
        .reset_index(name="Horas_asignadas")
        .sort_values(["Nivel", "Aula", "C√≥digo_materia"])
    )

    return resumen

# Ejemplo de uso:
df_horas = contar_horas_por_materia(cromosoma_ejemplo)
df_horas


Unnamed: 0,Nivel,Aula,C√≥digo_materia,Horas_asignadas
0,10EGB,Pacifistas,BIO_10EGB,3
1,10EGB,Pacifistas,COM_10EGB,1
2,10EGB,Pacifistas,DAN_10EGB,1
3,10EGB,Pacifistas,DER_10EGB,1
4,10EGB,Pacifistas,DES_10EGB,2
...,...,...,...,...
1095,9EGB,Aut√©nticos,QUI_9EGB,6
1096,9EGB,Aut√©nticos,ROB_9EGB,2
1097,9EGB,Aut√©nticos,SAL_9EGB,1
1098,9EGB,Aut√©nticos,SOC_9EGB,3


## üîç Verificaci√≥n de materias con carga horaria incompleta por aula

Esta funci√≥n compara la cantidad de horas **asignadas** vs. **requeridas** para cada materia en cada aula, identificando aquellas que no cumplen con su carga horaria establecida.

### ¬øQu√© hace esta funci√≥n?
1. Convierte el cromosoma en un `DataFrame` para an√°lisis tabular.
2. Calcula cu√°ntas horas ha sido asignada cada materia por curso y paralelo.
3. Replica la estructura esperada de materias por aula a partir de los archivos `materias.csv` y `paralelos.csv`.
4. Compara lo asignado con lo requerido.
5. Devuelve un `DataFrame` con aquellas materias que tienen **horas faltantes**.

### Aplicaciones:
- Diagn√≥stico inmediato de **inconsistencias estructurales** en un cromosoma.
- Verificaci√≥n post-evolutiva para asegurar **factibilidad horaria**.
- Gu√≠a para penalizaciones dentro de la funci√≥n fitness.

> ‚úÖ Este paso es cr√≠tico para garantizar que todas las materias se impartan el n√∫mero adecuado de veces seg√∫n lo planificado por el colegio.


In [None]:
import pandas as pd

def verificar_materias_faltantes(cromosoma, materias_df, paralelos_df):
    """
    Compara la cantidad de horas asignadas vs requeridas para cada materia en cada aula.

    Retorna un DataFrame con las materias faltantes por aula.
    """
    # 1. Convertir cromosoma a DataFrame
    df_crom = pd.DataFrame(cromosoma, columns=["Nivel", "Aula", "D√≠a", "Hora", "C√≥digo", "Docente"])

    # 2. Contar horas asignadas por materia por aula
    asignadas = (
        df_crom.groupby(["Nivel", "Aula", "C√≥digo"])
        .size()
        .reset_index(name="Horas_asignadas")
    )

    # 3. Expandir requerimientos por aula
    requeridas = pd.merge(
        paralelos_df[["Nivel", "Nombre_paralelo"]],
        materias_df,
        on="Nivel",
        how="left"
    ).rename(columns={"Nombre_paralelo": "Aula", "C√≥digo": "C√≥digo", "Horas": "Horas_requeridas"})

    # 4. Unir ambas tablas
    comparacion = pd.merge(
        requeridas,
        asignadas,
        how="left",
        on=["Nivel", "Aula", "C√≥digo"]
    )

    comparacion["Horas_asignadas"] = comparacion["Horas_asignadas"].fillna(0).astype(int)
    comparacion["Faltan"] = comparacion["Horas_requeridas"] - comparacion["Horas_asignadas"]

    # 5. Filtrar las que faltan
    faltantes = comparacion[comparacion["Faltan"] > 0].sort_values(["Nivel", "Aula", "C√≥digo"])

    return faltantes


In [None]:
faltantes_df = verificar_materias_faltantes(cromosoma_ejemplo, materias, paralelos)
display(faltantes_df)


Unnamed: 0,Nivel,Aula,Materias,C√≥digo,Horas_requeridas,Horas_asignadas,Faltan


## üß± Evaluaci√≥n de restricciones duras en el cromosoma

Esta funci√≥n calcula una penalizaci√≥n acumulativa que representa cu√°ntas **restricciones duras** se han violado en un cromosoma generado. Estas restricciones son consideradas **obligatorias** para la validez del horario.

### üìã Restricciones aplicadas:

1. **üîó Continuidad de sesiones**  
   - Penaliza si una misma materia se asigna el mismo d√≠a pero con un hueco mayor a 2 horas (solo si tiene m√°s de 1 hora total en la semana).

2. **üìö Exceso de bloques continuos**  
   - Si una materia aparece m√°s de 3 veces de forma consecutiva el mismo d√≠a, se penaliza (excepto para casos pedag√≥gicos espec√≠ficos como MAT/LEN en 1EGB o MAT en 2EGB).

3. **üö´ Cruces de docentes**  
   - Se penaliza fuertemente si un docente aparece asignado a m√°s de un paralelo en el mismo bloque horario.
   - Se consideran **excepciones espec√≠ficas** por nombre y materia (por ejemplo, docentes de materias especiales como `EF ESPECIAL`, `INGLES ESPECIAL` o asignaturas de ciudadan√≠a en BGU).

### ‚öñÔ∏è Penalizaci√≥n:
- Penalizaciones peque√±as (0.1) para continuidad.
- Moderadas (2) para excesos seguidos.
- Fuertes (20√ón) por cruces de docentes.

> Esta funci√≥n se usa como parte del componente **fitness** en el algoritmo gen√©tico, y su correcta implementaci√≥n garantiza la **factibilidad estructural m√≠nima** del horario.


In [None]:
from collections import defaultdict

# Asumimos que este diccionario ya fue creado previamente
horas_por_materia = dict(zip(materias["C√≥digo"], materias["Horas"]))

def evaluar_restricciones_duras(cromosoma):
    penalizaciones = 0

    sesiones_por_materia = defaultdict(lambda: defaultdict(int))  # materia -> d√≠a -> cantidad
    sesiones_por_hora = defaultdict(list)  # (d√≠a, hora) -> lista de materias

    materia_actual = None
    dia_actual = None
    hora_anterior = None

    # 1. Verificaci√≥n de continuidad sin ordenar, aprovechando el orden del cromosoma
    for nivel, aula, dia, hora, materia, docente in cromosoma:
        dia = dia
        hora = int(hora)

        # Verificaci√≥n de continuidad
        if materia != materia_actual or dia != dia_actual:
            # reiniciamos el seguimiento
            materia_actual = materia
            dia_actual = dia
            hora_anterior = hora
        else:
            # comparaci√≥n directa, sin ordenar
            if horas_por_materia.get(materia, 0) > 1 and (hora - hora_anterior > 2):
                penalizaciones += 0.1

                # LOG de trazabilidad
                #print(f"[SIN CONTINUIDAD] {materia} en {nivel}-{aula} con {docente} el d√≠a {dia} entre hora {hora_anterior} y {hora}")

            hora_anterior = hora

        # Recuento para otras restricciones
        sesiones_por_materia[materia][dia] += 1
        sesiones_por_hora[(dia, hora)].append(materia)

    # 2. Restricci√≥n: m√°s de 3 horas continuas de una misma materia
    materia_anterior = None
    dia_anterior = None
    racha_continua = 1

    for i in range(1, len(cromosoma)):
        _, _, dia_act, hora_act, materia_act, _ = cromosoma[i]
        _, _, dia_ant, hora_ant, materia_ant, _ = cromosoma[i - 1]

        if nivel == "1EGB" and (materia == "MAT_1EGB" or materia == "LEN_1EGB"):
          continue

        if nivel == "2EGB" and materia == "MAT_2EGB":
          continue

        if materia_act == materia_ant and dia_act == dia_ant and int(hora_act) == int(hora_ant) + 1:
            racha_continua += 1
            if racha_continua > 3:
                penalizaciones += 2  # penalizaci√≥n moderada por exceso de continuidad
        else:
            racha_continua = 1  # reiniciar contador si cambia la materia o no es consecutiva

    # 3. Cruces de docentes en el mismo horario (con excepciones por nombre y cargo)
    docentes_en_tiempo = defaultdict(lambda: defaultdict(set))  # (d√≠a, hora) -> docente -> set de paralelos
    cargos_docentes = dict(zip(docentes["Nombres"], docentes["Cargo"]))  # asume que 'docentes' est√° cargado

    for nivel, paralelo, dia, hora, materia, docente in cromosoma:
        # Excepciones:
        if docente in {"EF ESPECIAL", "INGLES ESPECIAL"}:
            continue
        if docente == "JONATHAN CASTRO" and nivel == "3BGU":
            continue
        if docente == "JANETH MELO" and nivel == "3BGU":
            continue
        if materia == "CIU_1BGU" and  nivel=="1BGU":
            continue
        if materia == "CIU_2BGU" and  nivel=="2BGU":
            continue

        docentes_en_tiempo[(dia, hora)][docente].add(paralelo)

    for (dia, hora), docentes_dict in docentes_en_tiempo.items():
        for docente, paralelos in docentes_dict.items():
            if len(paralelos) > 1:
                # conflicto = f"[CRUCE] Docente: {docente} asignado a paralelos {sorted(paralelos)} el d√≠a {dia}, hora {hora}"
                # print(conflicto)
                penalizaciones += 20 * (len(paralelos) - 1)  # penalizaci√≥n fuerte por cruce real

    return penalizaciones



## üåø Evaluaci√≥n de restricciones blandas en el cromosoma

Esta funci√≥n calcula penalizaciones asociadas al incumplimiento de **restricciones blandas**, es decir, condiciones deseables que no invalidan el horario pero s√≠ afectan su calidad pedag√≥gica y organizacional.

### üìã Restricciones consideradas:

1. **üïò Medio tiempo**
   - Docentes con contrato de medio tiempo no deben impartir clases luego de la hora 10.
   - Penalizaci√≥n: +2 por cada sesi√≥n fuera del rango permitido.

2. **üë∂ Maternidad**
   - Docentes en r√©gimen de maternidad no deben tener sesiones m√°s all√° de la hora 14.
   - Penalizaci√≥n: +2 por cada infracci√≥n.

3. *(Planificada pero no operativa)*  
   **üìö Diversidad de materias por d√≠a**
   - El bloque incluye una estructura para detectar si hay demasiadas materias distintas por d√≠a en un aula, pero **actualmente no se registra informaci√≥n en `materias_por_dia`**, por lo tanto **no influye en la penalizaci√≥n** todav√≠a.

### ‚ú® Prop√≥sito:
Estas restricciones permiten incorporar aspectos humanos y pedag√≥gicos que mejoran la **satisfacci√≥n del personal docente** y la **fluidez del horario**, influyendo indirectamente en la evoluci√≥n de soluciones m√°s aceptables.

> üîß Esta funci√≥n se combina en el fitness como `Œ≤ ¬∑ penalizaci√≥n_blanda`, con un peso menor que las restricciones duras.


In [None]:
def evaluar_restricciones_blandas(cromosoma):
    penalizaciones = 0

    # Crear diccionarios r√°pidos de cargos y docentes
    cargo_docente = dict(zip(docentes["Nombres"], docentes["Cargo"]))

    sesiones_por_dia_docente = defaultdict(lambda: defaultdict(list))  # docente -> d√≠a -> horas
    materias_por_dia = defaultdict(set)

    for nivel, aula, dia, hora, materia, docente in cromosoma:
        if not materia.isupper():
            continue

        # 1. Horario de medio tiempo (ma√±ana = hasta 12pm => Hora 8)
        if cargo_docente.get(docente) == "Medio tiempo" and int(hora) > 10:
            penalizaciones += 2

        # 2. Maternidad (√∫ltima hora debe ser m√°ximo la 14)
        if cargo_docente.get(docente) == "Maternidad" and int(hora) > 14:
            penalizaciones += 2

        # Registrar para posibles evaluaciones futuras
        sesiones_por_dia_docente[docente][dia].append(int(hora))

    for (aula, dia), codigos in materias_por_dia.items():
        if len(codigos) > 3:
            penalizaciones += (len(codigos) - 3)

    return penalizaciones

## üßÆ Funci√≥n fitness con ponderaci√≥n de restricciones duras y blandas

Esta funci√≥n eval√∫a la calidad (fitness) de un cromosoma considerando las penalizaciones acumuladas por el incumplimiento de restricciones:

### ‚öñÔ∏è F√≥rmula utilizada:
$
\text{fitness} = \frac{1}{1 + (\alpha \cdot \text{penalizaci√≥n}_\text{dura} + \beta \cdot \text{penalizaci√≥n}_\text{blanda})}
$

### Par√°metros:
- `alpha`: peso asignado a las restricciones duras (por defecto: 1.0).
- `beta`: peso asignado a las restricciones blandas (por defecto: 0.2).

### ¬øQu√© representa el resultado?
- Un valor cercano a **1.0** indica un cromosoma muy bueno (baja penalizaci√≥n).
- Un valor cercano a **0.0** indica un cromosoma altamente penalizado.

> üß† Esta m√©trica gu√≠a el proceso evolutivo, permitiendo seleccionar, cruzar y mutar aquellos cromosomas que respetan m√°s las reglas institucionales del horario escolar.



In [None]:
# Funci√≥n fitness con ponderaciones para restricciones duras y blandas
def fitness(cromosoma, alpha=1.0, beta=0.2):
    penal_duras = evaluar_restricciones_duras(cromosoma)
    penal_blandas = evaluar_restricciones_blandas(cromosoma)

    penal_total = alpha * penal_duras + beta * penal_blandas
    score = 1 / (1 + penal_total)

    return score

## üß© Funci√≥n de fitness con evaluaci√≥n por nivel (split)

Esta funci√≥n calcula el `fitness` total de un cromosoma y, adicionalmente, descompone el resultado por **nivel educativo** (1EGB, 2EGB, ..., 3BGU). Esto permite realizar an√°lisis m√°s detallados sobre el rendimiento evolutivo de cada subhorario.

### ¬øC√≥mo funciona?

- Se agrupan los genes del cromosoma seg√∫n su nivel (`gen[0]`).
- Se eval√∫a cada subconjunto (`subcromosoma`) usando la funci√≥n tradicional `fitness()`.
- Se guarda el `fitness` por nivel en un diccionario.
- Se retorna tanto el `fitness` total del cromosoma completo como el diccionario por split.

### Retorna:
- `total_fitness`: fitness completo del cromosoma.
- `fitness_por_split`: diccionario con la forma `{nivel: score}`.

### Aplicaciones:
- üìä Visualizaci√≥n de progreso por nivel en la evoluci√≥n.
- üìâ Detecci√≥n de niveles que impiden mejorar el fitness global.
- üîç Posibilita estrategias de evoluci√≥n adaptativa por subgrupo.

> ‚ö†Ô∏è Actualmente, `total_fitness` se recalcula en cada iteraci√≥n dentro del loop, lo que es redundante. Podr√≠a optimizarse llamando a `fitness(cromosoma)` una sola vez antes del bucle.


In [None]:
def fitness_con_split(cromosoma, alpha=1.0, beta=0.2):
    from collections import defaultdict

    # Agrupar genes por nivel (gen[0] es el nivel)
    genes_por_nivel = defaultdict(list)
    for gen in cromosoma:
        nivel = gen[0]
        genes_por_nivel[nivel].append(gen)

    fitness_por_split = {}
    total_fitness = 0

    for nivel, subcromosoma in genes_por_nivel.items():
        # Calcular fitness del subcromosoma con funci√≥n tradicional
        score_nivel = fitness(subcromosoma, alpha=alpha, beta=beta)
        fitness_por_split[nivel] = score_nivel
        total_fitness = fitness(cromosoma)

    return total_fitness, fitness_por_split


## üå± Generaci√≥n de la poblaci√≥n inicial para el algoritmo gen√©tico

Este bloque crea la poblaci√≥n base sobre la cual el algoritmo gen√©tico comenzar√° su evoluci√≥n. Incluye tanto conocimiento previo como diversidad gen√©tica.

### Estructura del proceso:

1. **üì• Carga de un cromosoma hist√≥rico**
   - Se importa un horario real del colegio (por ejemplo, el del a√±o anterior) desde un archivo `.txt`.
   - Esta soluci√≥n v√°lida se incluye directamente en la poblaci√≥n para preservar una base de calidad.

2. **üß¨ Generaci√≥n de nuevos cromosomas**
   - Se generan cromosomas aleatorios usando la funci√≥n `generar_cromosoma()`, que respeta las restricciones del problema.
   - Esto garantiza diversidad gen√©tica y aumenta las posibilidades de encontrar soluciones √≥ptimas en generaciones futuras.

### Par√°metro:
- `tamano_poblacion`: cantidad total de cromosomas iniciales (por defecto: 100).

> Esta combinaci√≥n de conocimiento previo y soluciones aleatorias acelera la convergencia y mejora la calidad evolutiva desde las primeras generaciones.



In [None]:
def cargar_cromosoma_desde_txt(nombre_archivo):
    cromosoma = []
    with open(nombre_archivo, "r", encoding="utf-8") as f:
        for linea in f:
            linea = linea.strip()
            if linea:
                cromosoma.append(eval(linea))
    return cromosoma

def generar_poblacion_inicial(tamano_poblacion=100, ruta_horario_valido=ruta + "/Horario_LEV.txt"):
    poblacion = []


    # ‚úÖ 1. Cargar el cromosoma v√°lido del a√±o anterior
    cromosoma_historico = cargar_cromosoma_desde_txt(ruta_horario_valido)
    poblacion.append(cromosoma_historico)

    # ‚úÖ 2. Generar cromosomas adicionales
    while len(poblacion) < tamano_poblacion:
        cromosoma_nuevo = generar_cromosoma()
        poblacion.append(cromosoma_nuevo)

    return poblacion

# Generar la poblaci√≥n inicial
poblacion_inicial = generar_poblacion_inicial(tamano_poblacion=100)

üîµ **Flujo general del ciclo gen√©tico:**

1. **Evaluar fitness** de la poblaci√≥n inicial.
2. **Seleccionar padres** (basado en fitness, por ejemplo, torneo, ruleta, elitismo).
3. **Aplicar crossover** (cruce de padres para generar hijos).
4. **Aplicar mutaci√≥n** (alterar genes de hijos con cierta probabilidad).
5. **Evaluar fitness** de los nuevos individuos.
6. **Formar nueva poblaci√≥n** (reemplazar parcialmente o completamente).
7. **Repetir** desde el paso 2 hasta cumplir el criterio de parada (n generaciones o fitness deseado).


## ‚öôÔ∏è Evaluaci√≥n paralela del fitness en la poblaci√≥n

Estas funciones permiten evaluar el fitness de m√∫ltiples cromosomas en paralelo, acelerando significativamente el proceso evolutivo en cada generaci√≥n del algoritmo gen√©tico.

### Funciones definidas:

- `evaluar2(cromosoma)`: versi√≥n directa que llama a `fitness()` sobre un cromosoma.
- `evaluar2_split(cromosoma)`: eval√∫a un cromosoma completo y retorna el fitness por nivel (`split_info`) mediante `fitness_con_split()`.
- `evaluar_fitness_poblacion(poblacion)`: eval√∫a toda la poblaci√≥n utilizando **hilos paralelos** (`ThreadPoolExecutor`), mejorando el rendimiento computacional.

### Par√°metros clave:
- `alpha`, `beta`: ponderaciones para restricciones duras y blandas.
- `num_procesos`: n√∫mero de n√∫cleos l√≥gicos que se usar√°n para la evaluaci√≥n concurrente.

> üí° La evaluaci√≥n paralela es cr√≠tica cuando el tama√±o de la poblaci√≥n es grande (e.g., >100 cromosomas), ya que reduce el tiempo por generaci√≥n sin afectar la calidad de la evaluaci√≥n.


In [None]:
from concurrent.futures import ProcessPoolExecutor
import os

def evaluar2_split(cromosoma, alpha=1.0, beta=0.2):
    score, split_info = fitness_con_split(cromosoma, alpha=alpha, beta=beta)
    return score, split_info
def evaluar2(cromosoma, alpha=1.0, beta=0.2):
        return fitness(cromosoma, alpha=alpha, beta=beta)

def evaluar_fitness_poblacion(poblacion, alpha=1.0, beta=0.2, num_procesos=2):
    from concurrent.futures import ThreadPoolExecutor

    with ThreadPoolExecutor(max_workers=num_procesos) as executor:
        resultados = list(executor.map(
            lambda cromo: fitness(cromo, alpha=alpha, beta=beta),
            poblacion
        ))

    return resultados


## üß† Evaluaci√≥n paralela del fitness por nivel (con split) en toda la poblaci√≥n

Esta funci√≥n permite evaluar en paralelo todos los cromosomas de la poblaci√≥n, retornando tanto el `fitness global` como un `detalle por nivel educativo` (split) de cada cromosoma.

### Caracter√≠sticas:
- Usa `ProcessPoolExecutor` para aprovechar m√∫ltiples n√∫cleos f√≠sicos y evitar el GIL de Python.
- Cada cromosoma es evaluado mediante `evaluar2_split()`, que calcula:
  - `fitness global` total del cromosoma.
  - `fitness por nivel` desglosado.

### ¬øQu√© retorna?
- `fitness_scores`: lista de valores de fitness global, uno por cromosoma.
- `fitness_por_split`: lista de diccionarios `{nivel: score}`, uno por cromosoma.

### Aplicaciones:
- üîç An√°lisis de convergencia por nivel educativo (1EGB a 3BGU).
- üìä Visualizaci√≥n de avances diferenciados dentro de la poblaci√≥n.
- üéØ Selecci√≥n dirigida o estrategias de evoluci√≥n espec√≠ficas por subgrupo.

> üß¨ Esta evaluaci√≥n enriquecida es √∫til en problemas **multinivel** como el scheduling educativo, donde cada nivel tiene sus propias restricciones, docentes y prioridades.


In [None]:
def evaluar_fitness_poblacion_con_split(poblacion, alpha=1.0, beta=0.2, num_procesos=None):
    if num_procesos is None:
        num_procesos = os.cpu_count()

    with ProcessPoolExecutor(max_workers=num_procesos) as executor:
        resultados = list(executor.map(evaluar2_split, poblacion))

    # Separar los valores globales y los diccionarios por split
    fitness_scores = [r[0] for r in resultados]
    fitness_por_split = [r[1] for r in resultados]

    return fitness_scores, fitness_por_split


## üß¨ Selecci√≥n de padres mediante elitismo (fitness general)

Esta funci√≥n implementa una estrategia de **selecci√≥n elitista**, donde se escogen los cromosomas con mejor fitness dentro de la poblaci√≥n para ser usados como padres en la siguiente generaci√≥n del algoritmo gen√©tico.

### ¬øC√≥mo funciona?
1. Combina cada cromosoma con su respectivo valor de fitness.
2. Ordena la poblaci√≥n de mayor a menor score de fitness.
3. Selecciona los `cantidad_padres` mejores individuos (sin duplicaci√≥n).

### Par√°metros:
- `poblacion`: lista de cromosomas.
- `fitness_poblacion`: lista de valores de fitness asociados a la poblaci√≥n.
- `cantidad_padres`: n√∫mero de padres a seleccionar para reproducir.

### Aplicaciones:
- üß† Mantiene soluciones de alta calidad a lo largo de las generaciones.
- üö´ Evita que soluciones v√°lidas se pierdan por azar.
- üìà Favorece la convergencia r√°pida del algoritmo.

> üîç Este mecanismo se puede complementar con otras estrategias de diversidad como **torneos** o **ruleta**, si se desea evitar estancamientos evolutivos.



In [None]:
# Funci√≥n para seleccionar padres usando elitismo con fitness general
def seleccionar_padres_elitismo(poblacion, fitness_poblacion, cantidad_padres=20):
    # Combinar cromosomas con sus valores de fitness
    poblacion_con_fitness = list(zip(poblacion, fitness_poblacion))

    # Ordenar de mayor a menor fitness
    poblacion_con_fitness.sort(key=lambda x: x[1], reverse=True)

    # Seleccionar los mejores 'cantidad_padres' cromosomas
    padres_seleccionados = [individuo for individuo, fitness in poblacion_con_fitness[:cantidad_padres]]

    return padres_seleccionados

# Ejemplo de uso
cantidad_padres = 20
padres = seleccionar_padres_elitismo(poblacion_inicial, fitness_inicial, cantidad_padres=cantidad_padres)

print(f"Total de padres seleccionados: {len(padres)}")

Total de padres seleccionados: 20


## üß¨ Estrategia de Crossover: `crossover_hibrido_heuristico_burke`

Este operador se basa en el enfoque de Burke et al. (1995) adaptado a la estructura y restricciones del problema de generaci√≥n de horarios escolares con materias sincronizadas, bloques contiguos y restricciones docentes.

---

### üî¢ Fases del Crossover

### üß© FASE 1 ‚Äì Herencia de Bloques Sincronizados
- Se heredan bloques completos por materia y nivel.
- Se selecciona un padre como fuente de la franja horaria (d√≠a y hora).
- Se valida disponibilidad de esa franja para todas las aulas del nivel.
- Se insertan todas las asignaciones del bloque, **manteniendo sincronizaci√≥n por nivel**.

**Materias tratadas como bloques sincronizados:**
- `INGLES ESPECIAL` (7EGB‚Äì3BGU)
- `CIU_1BGU`, `CIU_2BGU`
- Materias dictadas por `JONATHAN CASTRO` y `JANETH MELO` en 3BGU

---






In [None]:
from collections import defaultdict

def extraer_bloques_sincronizados_por_materia_y_nivel(cromosoma):
    """
    Extrae bloques sincronizados por (nivel, materia/docente) del cromosoma.
    Devuelve un diccionario: (materia_o_docente, nivel) -> { (d√≠a, hora): [genes] }
    """
    bloques = defaultdict(lambda: defaultdict(list))

    for gen in cromosoma:
        nivel, aula, dia, hora, materia, docente = gen

        # INGL√âS ESPECIAL: sincronizado por nivel desde 7EGB en adelante
        if materia == "INGLES ESPECIAL" and nivel in ["7EGB", "8EGB", "9EGB", "10EGB", "1BGU", "2BGU", "3BGU"]:
            bloques[("INGLES ESPECIAL", nivel)][(dia, hora)].append(gen)

        # JONATHAN CASTRO o JANETH MELO en 3BGU
        if (nivel == "3BGU" and materia == "EST_3BGU") or (nivel == "3BGU" and materia == "DES_3BGU"):
            bloques[(materia, nivel)][(dia, hora)].append(gen)

        # Ciudadan√≠a sincronizada
        if (nivel == "1BGU" and materia == "CIU_1BGU") or (nivel == "2BGU" and materia == "CIU_2BGU"):
            bloques[(materia, nivel)][(dia, hora)].append(gen)

    return bloques

from collections import Counter
import pandas as pd

def seleccionar_y_heredar_bloques_sincronizados(padre1, padre2):
    """
    Reescritura basada en el generador:
    - Para cada materia sincronizada por nivel, se identifica en qu√© franja horaria se asigna en cada padre.
    - Se elige la franja m√°s frecuente y se replica esa franja para todas las aulas del nivel en el hijo.
    """
    hijo = []
    bloques_padres = padre1 + padre2

    materias_especiales = [
        ("INGLES ESPECIAL", "7EGB"), ("INGLES ESPECIAL", "8EGB"), ("INGLES ESPECIAL", "9EGB"),
        ("INGLES ESPECIAL", "10EGB"), ("INGLES ESPECIAL", "1BGU"), ("INGLES ESPECIAL", "2BGU"), ("INGLES ESPECIAL", "3BGU"),
        ("EST_3BGU", "3BGU"), ("DES_3BGU", "3BGU"),
        ("CIU_1BGU", "1BGU"), ("CIU_2BGU", "2BGU")
    ]

    for materia, nivel in materias_especiales:
        # Contar franjas de aparici√≥n en los padres
        franjas = [
            (g[2], g[3]) for g in bloques_padres
            if g[4] == materia and g[0] == nivel
        ]
        if not franjas:
            continue

        franja_mas_comun = Counter(franjas).most_common(1)[0][0]
        dia, hora = franja_mas_comun

        # Aplicar a todas las aulas del nivel
        aulas = paralelos.loc[paralelos["Nivel"] == nivel, "Nombre_paralelo"].tolist()
        for aula in aulas:
            docente = obtener_docente_por_materia_codigo(materia)
            hijo.append((nivel, aula, dia, hora, materia, docente))
            # Si es en parejas, a√±adir la segunda hora
            if materia in ["INGLES ESPECIAL", "EST_3BGU", "DES_3BGU"]:
                hijo.append((nivel, aula, dia, hora + 1, materia, docente))

    return hijo


## üîó Extracci√≥n de bloques contiguos de materias emparejadas por nivel y aula

Esta funci√≥n identifica pares de materias que aparecen **de forma contigua** (una seguida de la otra en el horario) y que representan **combinaciones pedag√≥gicas v√°lidas**, como:
- `DER` + `COM`
- `SPE` + `INV`
- `EXP` + `CAL` o `RAZ`
- `DAN` + `MUS` (y viceversa)

### ¬øQu√© hace?
- Recorre el cromosoma nivel por nivel, aula por aula.
- Busca bloques de dos horas seguidas el mismo d√≠a.
- Si detecta un par v√°lido seg√∫n las reglas pedag√≥gicas, lo registra.


In [None]:
def extraer_bloques_contiguos_por_nivel(cromosoma):
    """
    Extrae todos los pares de materias contiguas v√°lidas por nivel y aula.
    Devuelve un diccionario: (nivel, aula) -> lista de tuplas [(hora, (materia1, materia2), (dia))]
    """
    pares_validos = {
        "DER": "COM",
        "SPE": "INV",
        "SAL": "ECO",
        "EXP_CAL": ("EXP", "CAL"),
        "EXP_RAZ": ("EXP", "RAZ"),
        "DAN_MUS": ("DAN", "MUS"),
        "MUS_DAN": ("MUS", "DAN")
    }

    bloques_contiguos = defaultdict(list)

    for nivel, aula, dia, hora, materia, _ in cromosoma:
        # Buscar siguiente hora en el mismo d√≠a
        siguiente = [
            g for g in cromosoma
            if g[0] == nivel and g[1] == aula and g[2] == dia and g[3] == hora + 1
        ]
        if not siguiente:
            continue

        siguiente_materia = siguiente[0][4]
        par = (materia, siguiente_materia)

        # Evaluar si es un par v√°lido
        if (materia.startswith("DER") and siguiente_materia.startswith("COM")) or \
           (materia.startswith("COM") and siguiente_materia.startswith("DER")) or \
           (materia.startswith("SPE") and siguiente_materia.startswith("INV")) or \
           (materia.startswith("INV") and siguiente_materia.startswith("SPE")) or \
           (materia.startswith("SAL") and siguiente_materia.startswith("ECO")) or \
           (materia.startswith("ECO") and siguiente_materia.startswith("SAL")) or \
           (materia.startswith("EXP") and siguiente_materia.startswith("CAL")) or \
           (materia.startswith("CAL") and siguiente_materia.startswith("EXP")) or \
           (materia.startswith("RAZ") and siguiente_materia.startswith("EXP")) or \
           (materia.startswith("EXP") and siguiente_materia.startswith("RAZ")) or \
           (materia.startswith("DAN") and siguiente_materia.startswith("MUS")) or \
           (materia.startswith("MUS") and siguiente_materia.startswith("DAN")):

            bloques_contiguos[(nivel, aula)].append((dia, hora, (materia, siguiente_materia)))

    return bloques_contiguos


### üîó FASE 2 ‚Äì Inserci√≥n de Pares Contiguos (2 bloques)
- Se procesan pares de materias que deben ir juntas y contiguas (ej. `DER‚ÄìCOM`, `SPE‚ÄìINV`, etc.).
- Se busca su aparici√≥n contigua en alguno de los padres.
- Se inserta en el hijo en un bloque de dos periodos consecutivos `(hora, hora+1)`.
- Se respeta la cuota de cada materia y la validez del horario.

---



In [None]:
# Reimportar librer√≠as necesarias despu√©s del reinicio
from collections import defaultdict
import random
import pandas as pd


def seleccionar_y_heredar_materias_en_pares(padre1, padre2, obtener_docente_por_materia_codigo):
    """
    FASE 2 corregida:
    - Hereda pares de materias contiguas desde ambos padres.
    - Solo se asigna un par v√°lido por aula (ej. DER‚ÄìCOM, SPE‚ÄìINV, etc.).
    - Evita duplicaci√≥n del mismo par en distintas franjas para un mismo aula.
    """
    hijo = []
    sesiones_hijo = set()

    pares_pref = [
        ("DER", "COM"), ("SPE", "INV"), ("SAL", "ECO"),
        ("EXP", "CAL"), ("EXP", "RAZ"), ("RAZ", "EXP"), ("CAL", "EXP"),
        ("DAN", "MUS"), ("MUS", "DAN")
    ]

    # Combinar pares contiguos v√°lidos desde ambos padres
    bloques_p1 = extraer_bloques_contiguos_por_nivel(padre1)
    bloques_p2 = extraer_bloques_contiguos_por_nivel(padre2)
    claves = set(bloques_p1.keys()).union(bloques_p2.keys())

    asignados_por_aula = defaultdict(set)  # (nivel, aula) -> set de (prefijo1, prefijo2)

    for clave in claves:
        nivel, aula = clave
        bloques1 = bloques_p1.get(clave, [])
        bloques2 = bloques_p2.get(clave, [])
        todos_los_pares = bloques1 + bloques2
        vistos = set()

        for dia, hora, (m1, m2) in todos_los_pares:
            clave_fr = (dia, hora, m1, m2)
            if clave_fr in vistos:
                continue
            vistos.add(clave_fr)

            if (nivel, aula, dia, hora) in sesiones_hijo or (nivel, aula, dia, hora + 1) in sesiones_hijo:
                continue

            # Detectar los prefijos
            pref1, pref2 = m1.split("_")[0], m2.split("_")[0]
            par_actual = tuple(sorted((pref1, pref2)))

            # Validar si es un par permitido
            if par_actual not in [tuple(sorted(p)) for p in pares_pref]:
                continue

            # Verificar si ya fue asignado este par en esa aula
            if par_actual in asignados_por_aula[(nivel, aula)]:
                continue

            # Asignar el par
            d1 = obtener_docente_por_materia_codigo(m1)
            d2 = obtener_docente_por_materia_codigo(m2)
            hijo.append((nivel, aula, dia, hora, m1, d1))
            hijo.append((nivel, aula, dia, hora + 1, m2, d2))

            sesiones_hijo.add((nivel, aula, dia, hora))
            sesiones_hijo.add((nivel, aula, dia, hora + 1))
            asignados_por_aula[(nivel, aula)].add(par_actual)

    return hijo

### ‚öôÔ∏è FASE 3 ‚Äì Asignaci√≥n del Resto de Materias
- Para cada aula, se construye una "bolsa" con materias restantes seg√∫n cuota.
- Se recorren los slots libres v√°lidos del horario (`es_horario_valido`) e insertan materias restantes de forma aleatoria o por heur√≠stica.
- Se asegura que el total de asignaciones por aula sea exactamente **59**.

---


In [None]:
from collections import defaultdict
import random

from collections import defaultdict
import random

def asignar_materias_restantes_con_herencia(
    cromosoma_actual,
    materias_df,
    paralelos,
    horas_por_materia,
    obtener_docente_por_materia_codigo,
    es_horario_valido,
    padre1,
    padre2
):
    """
    Completa el cromosoma asegurando que cada aula tenga 59 genes.
    Preserva la herencia de horarios desde los padres si es posible.
    Si no, asigna en espacios disponibles como fallback.
    """
    cromosoma = list(cromosoma_actual)
    sesiones_ocupadas = {(n, a, d, h) for n, a, d, h, _, _ in cromosoma}
    cuenta_materias = defaultdict(lambda: defaultdict(int))  # (nivel, aula) -> materia -> count

    # Inicializar conteo por materia por aula
    for n, a, _, _, m, _ in cromosoma:
        cuenta_materias[(n, a)][m] += 1

    niveles = paralelos["Nivel"].unique()
    dias_semana = ["Lunes", "Martes", "Mi√©rcoles", "Jueves", "Viernes"]

    for nivel in niveles:
        aulas = paralelos.loc[paralelos["Nivel"] == nivel, "Nombre_paralelo"]
        materias_nivel = materias_df[materias_df["Nivel"] == nivel]["C√≥digo"].tolist()

        for aula in aulas:
            genes_aula = [g for g in cromosoma if g[0] == nivel and g[1] == aula]
            total_actual = len(genes_aula)
            if total_actual >= 59:
                continue

            bolsa = []
            for cod in materias_nivel:
                horas_necesarias = horas_por_materia.get(cod, 0)
                actuales = cuenta_materias[(nivel, aula)].get(cod, 0)
                faltantes = max(0, horas_necesarias - actuales)
                bolsa += [cod] * faltantes

            random.shuffle(bolsa)
            for cod in bolsa:
                docente = obtener_docente_por_materia_codigo(cod)
                heredado = False

                # Intentar heredar franja desde padres
                for padre in [padre1, padre2]:
                    for n, a, d, h, m, _ in padre:
                        if n == nivel and a == aula and m == cod and (n, a, d, h) not in sesiones_ocupadas and es_horario_valido(n, d, h):
                            cromosoma.append((n, a, d, h, m, docente))
                            sesiones_ocupadas.add((n, a, d, h))
                            cuenta_materias[(n, a)][m] += 1
                            heredado = True
                            break
                    if heredado:
                        break

                # Si no se pudo heredar, asignar en espacio libre
                if not heredado:
                    for d in dias_semana:
                        for h in range(1, 17):
                            if (nivel, aula, d, h) in sesiones_ocupadas:
                                continue
                            if not es_horario_valido(nivel, d, h):
                                continue
                            cromosoma.append((nivel, aula, d, h, cod, docente))
                            sesiones_ocupadas.add((nivel, aula, d, h))
                            cuenta_materias[(nivel, aula)][cod] += 1
                            break
                        else:
                            continue
                        break

    return cromosoma


### üõ†Ô∏è Reglas Generales
- Ning√∫n `(nivel, aula, d√≠a, hora)` debe contener m√°s de una asignaci√≥n.
- No se deben omitir materias, se garantiza un cromosoma completo con **2832 genes**.
- Los docentes se asignan din√°micamente con la funci√≥n:  
  `obtener_docente_por_materia_codigo(materia)`
- Todo bloque se valida antes de ser insertado para garantizar factibilidad.

---

### üìå Referencia
Adaptado del paper:  
**"A Hybrid Genetic Algorithm for Highly Constrained Timetabling Problems"**  
Rupert Weare, Edmund Burke & Dave Elliman (1995)

In [None]:
def crossover_hibrido_heuristico_burke(padre1, padre2):
    """
    Crossover h√≠brido basado en Burke et al. (1995) adaptado para el problema de scheduling escolar.
    Integra:
    - Fase 1: Herencia de bloques sincronizados por nivel.
    - Fase 2: Herencia de bloques contiguos por aula (pares de materias).
    - Fase 3: Asignaci√≥n de materias restantes preservando herencia horaria.

    Variables globales requeridas:
    - materias, paralelos, horas_por_materia
    - obtener_docente_por_materia_codigo, es_horario_valido
    """
    # FASE 1: bloques sincronizados (como INGL√âS ESPECIAL o CIU)
    hijo = seleccionar_y_heredar_bloques_sincronizados(padre1, padre2)

    # FASE 2: bloques contiguos v√°lidos (parejas como DER-COM)
    hijo += seleccionar_y_heredar_materias_en_pares(padre1, padre2, obtener_docente_por_materia_codigo)

    # FASE 3: completar con herencia prioritaria
    hijo = asignar_materias_restantes_con_herencia(
        cromosoma_actual=hijo,
        materias_df=materias,
        paralelos=paralelos,
        horas_por_materia=horas_por_materia,
        obtener_docente_por_materia_codigo=obtener_docente_por_materia_codigo,
        es_horario_valido=es_horario_valido,
        padre1=padre1,
        padre2=padre2
    )

    return ordenar_cromosoma(hijo)

# Ejemplo de uso
hijo_ejemplo = crossover_hibrido_heuristico_burke(padres[3], padres[5]) #2 y  10

# Inspecci√≥n de genes
print(f"Total de genes generados: {len(hijo_ejemplo)}")
for gen in hijo_ejemplo[:]:
    print(gen)


Total de genes generados: 2832
('1EGB', 'Ejemplares', 'Lunes', 1, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 2, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Lunes', 3, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 4, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Lunes', 6, 'EXT_1EGB', 'MARIEL RODRIGUEZ')
('1EGB', 'Ejemplares', 'Lunes', 7, 'LEC_1EGB', 'ALISON PLAZA')
('1EGB', 'Ejemplares', 'Lunes', 8, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 9, 'ING_1EGB', 'MARCIA HERRERA V√ÅSQUEZ')
('1EGB', 'Ejemplares', 'Lunes', 10, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 13, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 14, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Martes', 1, 'ECO_1EGB', 'MARJURIE J√ÅCOME')
('1EGB', 'Ejemplares', 'Martes', 2, 'SAL_1EGB', 'VANESSA ESP√çN')
('1EGB', 'Ejemplares', 'Martes', 3, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Marte

In [None]:
# Uso:
ctr = contar_asignaciones_por_aula(hijo_ejemplo)
for (nivel, aula), num_genes in ctr.items():
    print(f"{nivel} ‚Ä¢ {aula}: {num_genes}")


1EGB ‚Ä¢ Ejemplares: 59
1EGB ‚Ä¢ Entusiastas: 59
1EGB ‚Ä¢ Estudiosos: 59
1EGB ‚Ä¢ Exitosos: 59
2EGB ‚Ä¢ Afectuosos: 59
2EGB ‚Ä¢ Amables: 59
2EGB ‚Ä¢ Amigables: 59
2EGB ‚Ä¢ Amistosos: 59
3EGB ‚Ä¢ Colaboradores: 59
3EGB ‚Ä¢ Conciliadores: 59
3EGB ‚Ä¢ Cordiales: 59
3EGB ‚Ä¢ Creativos: 59
4EGB ‚Ä¢ Optimistas: 59
4EGB ‚Ä¢ Ordenados: 59
4EGB ‚Ä¢ Organizados: 59
4EGB ‚Ä¢ Originales: 59
5EGB ‚Ä¢ Admirables: 59
5EGB ‚Ä¢ Afectivos: 59
5EGB ‚Ä¢ Aplicados: 59
5EGB ‚Ä¢ Atentos: 59
6EGB ‚Ä¢ Ecu√°nimes: 59
6EGB ‚Ä¢ Emprendedores: 59
6EGB ‚Ä¢ Excelentes: 59
6EGB ‚Ä¢ Expresivos: 59
7EGB ‚Ä¢ Reflexivos: 59
7EGB ‚Ä¢ Resilientes: 59
7EGB ‚Ä¢ Respetuosos: 59
7EGB ‚Ä¢ Responsables: 59
8EGB ‚Ä¢ Decididos: 59
8EGB ‚Ä¢ Diligentes: 59
8EGB ‚Ä¢ Din√°micos: 59
8EGB ‚Ä¢ Disciplinados: 59
9EGB ‚Ä¢ Altruistas: 59
9EGB ‚Ä¢ Asertivos: 59
9EGB ‚Ä¢ Audaces: 59
9EGB ‚Ä¢ Aut√©nticos: 59
10EGB ‚Ä¢ Pacifistas: 59
10EGB ‚Ä¢ Perspicaces: 59
10EGB ‚Ä¢ Positivos: 59
1BGU ‚Ä¢ Confiables: 59
1BGU ‚Ä¢ Integros: 59
1BGU ‚Ä¢ Leales:

In [None]:
# Ejemplo de uso:
df_horas = contar_horas_por_materia(hijo_ejemplo)
df_horas

Unnamed: 0,Nivel,Aula,C√≥digo_materia,Horas_asignadas
0,10EGB,Pacifistas,BIO_10EGB,3
1,10EGB,Pacifistas,COM_10EGB,1
2,10EGB,Pacifistas,DAN_10EGB,1
3,10EGB,Pacifistas,DER_10EGB,1
4,10EGB,Pacifistas,DES_10EGB,2
...,...,...,...,...
1095,9EGB,Aut√©nticos,QUI_9EGB,6
1096,9EGB,Aut√©nticos,ROB_9EGB,2
1097,9EGB,Aut√©nticos,SAL_9EGB,1
1098,9EGB,Aut√©nticos,SOC_9EGB,3


In [None]:
faltantes_df = verificar_materias_faltantes(hijo_ejemplo, materias, paralelos)
display(faltantes_df)


Unnamed: 0,Nivel,Aula,Materias,C√≥digo,Horas_requeridas,Horas_asignadas,Faltan


## üß¨ Comparaci√≥n de herencia gen√©tica entre padres e hijo

Esta funci√≥n permite visualizar de manera detallada **de d√≥nde proviene cada gen** (asignaci√≥n de materia en una franja horaria) dentro de un cromosoma hijo, en relaci√≥n con sus dos padres.

### ¬øQu√© eval√∫a?
Para cada `(nivel, aula, d√≠a, hora)`:
- Si la materia del hijo coincide con la del Padre 1 ‚Üí üü¶
- Si coincide con la del Padre 2 ‚Üí üü©
- Si no coincide con ninguno (nuevo valor) ‚Üí üüß (Reconstruido)

### Resultado:
Imprime un reporte por aula, donde cada l√≠nea muestra:
- El d√≠a
- La hora
- La materia asignada
- La fuente del gen (Padre 1, Padre 2 o Reconstruido)

### Aplicaciones:
- üîç Auditor√≠a del operador de crossover.
- üìä Evaluaci√≥n cualitativa de la diversidad gen√©tica del hijo.
- üß† An√°lisis de cu√°nta herencia se preserva y cu√°nta se genera de forma aleatoria o heur√≠stica.

> Esta herramienta es √∫til tanto en etapas de debugging como para justificar la implementaci√≥n de estrategias de herencia controlada en el algoritmo evolutivo.


In [None]:
from collections import defaultdict

def comparar_herencia_genes(padre1, padre2, hijo):
    print("üîç Comparaci√≥n de herencia gen por gen\n")

    genes_p1 = {(n, a, d, h): m for n, a, d, h, m, _ in padre1}
    genes_p2 = {(n, a, d, h): m for n, a, d, h, m, _ in padre2}

    herencia_por_bloque = defaultdict(list)

    for gen in hijo:
        nivel, aula, dia, hora, materia_h, _ = gen
        key = (nivel, aula, dia, hora)

        materia_p1 = genes_p1.get(key)
        materia_p2 = genes_p2.get(key)

        if materia_h == materia_p1:
            fuente = "üü¶ Padre 1"
        elif materia_h == materia_p2:
            fuente = "üü© Padre 2"
        else:
            fuente = "üüß Reconstruido"

        herencia_por_bloque[(nivel, aula)].append((key, materia_h, fuente))

    # Mostrar agrupado
    for (nivel, aula), registros in sorted(herencia_por_bloque.items()):
        print(f"\nüìö Nivel: {nivel} | Aula: {aula}")
        print("-" * 60)
        for (n, a, d, h), mat, src in sorted(registros, key=lambda x: (x[0][2], x[0][3])):  # orden por d√≠a y hora
            print(f"{d:<10} {h:>2}h ‚Üí {mat:<12} ‚Üê {src}")
        print("-" * 60)


In [None]:
comparar_herencia_genes(padres[3], padres[5], hijo_ejemplo)


üîç Comparaci√≥n de herencia gen por gen


üìö Nivel: 10EGB | Aula: Pacifistas
------------------------------------------------------------
Jueves      1h ‚Üí SOC_10EGB    ‚Üê üü¶ Padre 1
Jueves      2h ‚Üí DES_10EGB    ‚Üê üü¶ Padre 1
Jueves      3h ‚Üí BIO_10EGB    ‚Üê üü¶ Padre 1
Jueves      4h ‚Üí PLA_10EGB    ‚Üê üü¶ Padre 1
Jueves      5h ‚Üí PEN_10EGB    ‚Üê üü¶ Padre 1
Jueves      7h ‚Üí QUI_10EGB    ‚Üê üü¶ Padre 1
Jueves      8h ‚Üí EMP_10EGB    ‚Üê üü¶ Padre 1
Jueves      9h ‚Üí LEN_10EGB    ‚Üê üü¶ Padre 1
Jueves     10h ‚Üí LEC_10EGB    ‚Üê üü¶ Padre 1
Jueves     11h ‚Üí FIS_10EGB    ‚Üê üü¶ Padre 1
Jueves     12h ‚Üí GEO_10EGB    ‚Üê üü¶ Padre 1
Jueves     15h ‚Üí PRO_10EGB    ‚Üê üü¶ Padre 1
Jueves     16h ‚Üí QUI_10EGB    ‚Üê üü¶ Padre 1
Lunes       1h ‚Üí PEN_10EGB    ‚Üê üü¶ Padre 1
Lunes       2h ‚Üí LEN_10EGB    ‚Üê üü¶ Padre 1
Lunes       3h ‚Üí ECO_10EGB    ‚Üê üü¶ Padre 1
Lunes       4h ‚Üí SAL_10EGB    ‚Üê üü¶ Padre 1
Lunes       5h ‚Üí FIS_10

## üîÅ Operador de mutaci√≥n: intercambio de materias dentro del mismo nivel

Este operador de mutaci√≥n introduce variaci√≥n gen√©tica en el cromosoma (hijo) al intercambiar aleatoriamente dos asignaciones (genes) **dentro del mismo nivel educativo**, preservando as√≠ la coherencia estructural del horario.

### üß¨ ¬øC√≥mo funciona?

1. Para cada nivel (e.g. 6EGB, 1BGU), se identifica la sublista de genes correspondientes.
2. Con una probabilidad `prob_mutacion`, se seleccionan dos posiciones aleatorias dentro de ese nivel.
3. Se intercambian las **materias** y los **docentes correspondientes** entre esas dos posiciones.
4. Las dem√°s propiedades del gen (nivel, aula, d√≠a, hora) se conservan.

### Par√°metro:
- `prob_mutacion`: probabilidad con la que se aplica el intercambio en cada nivel (por defecto: 10%).

### Ventajas:
- üîÑ Mantiene la asignaci√≥n horaria constante (no cambia d√≠as ni horas).
- üé≤ Introduce variabilidad sin romper la estructura del horario.
- üìä Ayuda a escapar de √≥ptimos locales durante la evoluci√≥n.

> üí° Este tipo de mutaci√≥n es especialmente √∫til cuando el crossover ya genera soluciones v√°lidas pero se desea **refinar o explorar nuevas combinaciones** sin perturbar demasiado la factibilidad.



In [None]:
import random
from copy import deepcopy
# Funci√≥n de mutaci√≥n: intercambio de materias en el mismo nivel
def mutacion_intercambio(hijo, prob_mutacion=0.1):
    hijo_mutado = deepcopy(hijo)

    niveles = set(gen[0] for gen in hijo_mutado)

    for nivel in niveles:
        # Obtener √≠ndices del nivel actual
        indices_nivel = [i for i, gen in enumerate(hijo_mutado) if gen[0] == nivel]

        if len(indices_nivel) >= 2:
            # Con probabilidad prob_mutacion, aplicar swap
            if random.random() < prob_mutacion:
                idx1, idx2 = random.sample(indices_nivel, 2)

                # Intercambiar materias
                materia1 = hijo_mutado[idx1][4]
                materia2 = hijo_mutado[idx2][4]

                # Reasignar materias y docentes intercambiados
                nivel1, aula1, dia1, hora1, _, _ = hijo_mutado[idx1]
                nivel2, aula2, dia2, hora2, _, _ = hijo_mutado[idx2]

                docente1 = obtener_docente_por_materia_codigo(materia1)
                docente2 = obtener_docente_por_materia_codigo(materia2)

                hijo_mutado[idx1] = (nivel1, aula1, dia1, hora1, materia2, docente2)
                hijo_mutado[idx2] = (nivel2, aula2, dia2, hora2, materia1, docente1)

    return hijo_mutado

# Ejemplo de uso:
hijo_mutado = mutacion_intercambio(hijo_ejemplo, prob_mutacion=0.1)

# Inspecci√≥n visual
print("Primeros 10 genes del hijo despu√©s de la mutaci√≥n:")
for gen in hijo_mutado[:10]:
    print(gen)


Primeros 10 genes del hijo despu√©s de la mutaci√≥n:
('1EGB', 'Ejemplares', 'Lunes', 1, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 2, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Lunes', 3, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 4, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Lunes', 6, 'EXT_1EGB', 'MARIEL RODRIGUEZ')
('1EGB', 'Ejemplares', 'Lunes', 7, 'LEC_1EGB', 'ALISON PLAZA')
('1EGB', 'Ejemplares', 'Lunes', 8, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 9, 'ING_1EGB', 'MARCIA HERRERA V√ÅSQUEZ')
('1EGB', 'Ejemplares', 'Lunes', 10, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 13, 'MAT_1EGB', 'PAULINA √ëACATO')


## üß¨ Generaci√≥n de nueva poblaci√≥n a partir de padres seleccionados (elitismo + crossover + mutaci√≥n)

Esta funci√≥n implementa el ciclo reproductivo del algoritmo gen√©tico: a partir de la √©lite seleccionada mediante fitness, se genera una nueva poblaci√≥n mediante **cruce h√≠brido heur√≠stico** y **mutaci√≥n estructurada**.

### üß± ¬øC√≥mo funciona?

1. Se toman pares aleatorios de la lista de `padres`.
2. Se aplica el operador `crossover_hibrido_heuristico_burke()` para producir un hijo.
3. Se aplica `mutacion_intercambio()` sobre el hijo resultante.
4. El nuevo cromosoma es agregado a la nueva poblaci√≥n.

### Par√°metro:
- `prob_mutacion`: probabilidad de aplicar mutaci√≥n a cada hijo generado.

### Resultado:
Devuelve una lista con la **nueva generaci√≥n** de cromosomas, del mismo tama√±o que la cantidad de padres.

### Aplicaciones:
- üîÑ Introduce recombinaci√≥n gen√©tica para explorar el espacio de soluciones.
- üå± Preserva parcialmente el conocimiento de los padres mientras se generan soluciones nuevas.
- üìâ Junto con elitismo, permite conservar la calidad mientras se mantiene diversidad.

> üîç El crossover implementado sigue un enfoque h√≠brido basado en Burke et al. (2004), que favorece la herencia de bloques sincronizados y pares pedag√≥gicos clave.



In [None]:
# Funci√≥n para generar una nueva poblaci√≥n a partir de la √©lite
def generar_nueva_generacion(padres, prob_mutacion=0.1):
    nueva_generacion = []

    # Asumiendo que padres ya es una lista de individuos seleccionados
    cantidad_padres = len(padres)

    for _ in range(cantidad_padres):  # Generar tantos hijos como padres disponibles
        # Seleccionar dos padres aleatoriamente
        padre1, padre2 = random.sample(padres, 2)

        # Crossover
        hijo = crossover_hibrido_heuristico_burke(padre1, padre2)

        # Mutaci√≥n
        hijo_mutado = mutacion_intercambio(hijo, prob_mutacion=prob_mutacion)

        # Agregar hijo mutado a la nueva generaci√≥n
        nueva_generacion.append(hijo_mutado)

    return nueva_generacion


# Ejemplo de uso:
# padres = lista de cromosomas seleccionados con elitismo

nueva_generacion = generar_nueva_generacion(padres, prob_mutacion=0.1)

# Mostrar el tama√±o de la nueva generaci√≥n
print(f"N√∫mero de hijos generados: {len(nueva_generacion)}")


N√∫mero de hijos generados: 20


## üß¨ Formaci√≥n de nueva poblaci√≥n combinando √©lite y descendencia (herencia controlada)

Esta funci√≥n consolida una nueva poblaci√≥n gen√©tica seleccionando los mejores individuos entre los padres (√©lite) y los hijos generados, garantizando as√≠ la **herencia de calidad** y la **diversidad gen√©tica** en cada generaci√≥n.

### üß± ¬øQu√© hace?

1. Eval√∫a el `fitness` de todos los cromosomas: padres + hijos.
2. Selecciona los `tamano_poblacion_final` mejores individuos (elitismo global).
3. Si faltan individuos, genera nuevos hijos usando crossover + mutaci√≥n.
4. Asegura que la poblaci√≥n resultante tenga el tama√±o correcto.

### Par√°metros:
- `padres`: lista de cromosomas seleccionados por elitismo.
- `hijos`: lista de nuevos cromosomas generados.
- `tamano_poblacion_final`: tama√±o deseado para la siguiente generaci√≥n.
- `prob_mutacion`: probabilidad de aplicar mutaci√≥n a los hijos nuevos.

### Ventajas:
- üß† Se preservan soluciones de alta calidad generadas previamente.
- üîÑ Se promueve la exploraci√≥n del espacio de b√∫squeda con nuevos cromosomas.
- üìâ Reduce el riesgo de estancamiento evolutivo manteniendo diversidad gen√©tica.

> ‚ö†Ô∏è Esta funci√≥n **reval√∫a todo el conjunto** antes de decidir qu√© individuos conservar, lo que permite ajustes din√°micos por generaci√≥n.



In [None]:
# Funci√≥n para formar la nueva poblaci√≥n respetando la herencia gen√©tica
def formar_nueva_poblacion_heredada(padres, hijos, tamano_poblacion_final=100, prob_mutacion=0.1):
    # Combinar padres √©lite y nuevos hijos
    poblacion_completa = padres + hijos

    # Evaluar fitness de la poblaci√≥n completa
    fitness_completo = evaluar_fitness_poblacion(poblacion_completa)
    poblacion_fitness = list(zip(poblacion_completa, fitness_completo))

    # Ordenar por fitness de mayor a menor
    poblacion_fitness.sort(key=lambda x: x[1], reverse=True)

    # Seleccionar los mejores cromosomas disponibles
    nueva_poblacion = [individuo for individuo, _ in poblacion_fitness[:tamano_poblacion_final]]

    # Verificar si faltan individuos
    faltantes = tamano_poblacion_final - len(nueva_poblacion)

    # Completar los faltantes con hijos generados mediante crossover y mutaci√≥n
    if faltantes > 0:
        print(f"üîÑ Generando {faltantes} individuos adicionales con crossover entre padres para completar la poblaci√≥n.")
        while len(nueva_poblacion) < tamano_poblacion_final:
            padre1, padre2 = random.sample(padres, 2)
            hijo = crossover_hibrido_heuristico_burke(padre1, padre2)
            hijo_mutado = mutacion_intercambio(hijo, prob_mutacion=prob_mutacion)
            nueva_poblacion.append(hijo_mutado)

    # Truncar si por alguna raz√≥n se excedi√≥ el tama√±o
    return nueva_poblacion[:tamano_poblacion_final]

# Ejemplo de uso
nueva_poblacion = formar_nueva_poblacion_heredada(padres, nueva_generacion, tamano_poblacion_final=100, prob_mutacion=0.1)

# Mostrar el tama√±o final
print(f"‚úÖ N√∫mero total de individuos en la nueva poblaci√≥n: {len(nueva_poblacion)}")

üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.
‚úÖ N√∫mero total de individuos en la nueva poblaci√≥n: 100


## üìä An√°lisis de fitness promedio por nivel educativo (split)

Esta funci√≥n imprime el **fitness promedio por nivel** (e.g. 1EGB, 2EGB, ..., 3BGU) calculado sobre toda la poblaci√≥n. Se utiliza la funci√≥n `fitness_con_split()`, que descompone el fitness global en subcomponentes por nivel educativo.

### ¬øQu√© hace?

1. Recorre cada cromosoma en la poblaci√≥n.
2. Calcula el `fitness` por nivel para ese individuo.
3. Acumula los scores por nivel y calcula su promedio final.
4. Imprime el resultado ordenado.

### Aplicaciones:
- üß† Permite identificar **niveles problem√°ticos** que bajan el fitness global.
- üìâ Apoya decisiones para **focalizar mejoras evolutivas**.
- üìà √ötil para an√°lisis exploratorio o como criterio para detenci√≥n anticipada por subgrupo.

> üí° Complementa perfectamente las gr√°ficas de evoluci√≥n general, a√±adiendo un an√°lisis interno por subconjuntos funcionales del problema.


In [None]:
def imprimir_fitness_por_split(poblacion, alpha=1.0, beta=0.2):
    from collections import defaultdict
    acumulado = defaultdict(float)
    for cromosoma in poblacion:
        _, split_scores = fitness_con_split(cromosoma, alpha, beta)
        for split, valor in split_scores.items():
            acumulado[split] += valor

    print("\nüìä Fitness promedio por nivel:")
    for split, total in acumulado.items():
        promedio = total / len(poblacion)
        print(f"  ‚û§ {split}: {promedio:.2f}")


## üîÅ Ciclo principal de evoluci√≥n gen√©tica multigeneracional

Esta funci√≥n orquesta el proceso completo de evoluci√≥n gen√©tica para la optimizaci√≥n de horarios escolares, iterando sobre m√∫ltiples generaciones con evaluaci√≥n, selecci√≥n, cruce, mutaci√≥n y reemplazo.

### üß† ¬øQu√© hace esta funci√≥n?

1. Inicializa la poblaci√≥n con cromosomas candidatos.
2. Itera hasta un m√°ximo de `n_generaciones`:
   - Eval√∫a fitness total y por nivel (split).
   - Registra la historia del mejor y promedio fitness.
   - Imprime e informa el progreso en consola y en archivos de log.
   - Aplica selecci√≥n por elitismo, crossover y mutaci√≥n.
   - Forma una nueva poblaci√≥n respetando el tama√±o requerido.
3. Devuelve la √∫ltima poblaci√≥n y todos los historiales √∫tiles.

### Par√°metros:
- `poblacion_inicial`: lista de cromosomas iniciales.
- `evaluar_fitness_poblacion`: funci√≥n para calcular fitness general.
- `evaluar_fitness_poblacion_con_split`: evaluaci√≥n con desglose por nivel.
- `seleccionar_padres_elitismo`: funci√≥n de selecci√≥n de √©lite.
- `generar_nueva_generacion`: funci√≥n de crossover + mutaci√≥n.
- `formar_nueva_poblacion_heredada`: combinaci√≥n de √©lite e hijos.
- `n_generaciones`: n√∫mero m√°ximo de generaciones (default: 1000).
- `tamano_poblacion`: tama√±o de cada generaci√≥n.
- `cantidad_padres`: n√∫mero de padres para reproducci√≥n.
- `prob_mutacion`: probabilidad de mutaci√≥n aplicada a los hijos.
- `ruta_log`, `nombre_log`: para guardar trazabilidad de la evoluci√≥n.

### Devuelve:
- `poblacion`: poblaci√≥n final.
- `historial_mejor_fitness`: evoluci√≥n del mejor fitness.
- `historial_fitness_promedio`: evoluci√≥n del fitness promedio.
- `fitness_poblacion`: valores de fitness de la √∫ltima generaci√≥n.
- `historial_split_por_generacion`: historial de fitness por nivel educativo.

### Aplicaciones clave:
- üìà Seguimiento detallado del desempe√±o por generaci√≥n.
- üß¨ Evoluci√≥n progresiva con conservaci√≥n de soluciones de calidad.
- üß™ Control fino sobre cada etapa del proceso evolutivo.

> Esta funci√≥n constituye el **n√∫cleo operativo** del algoritmo gen√©tico aplicado al Educational Timetabling Problem (ECTP).


In [None]:
from datetime import datetime
from collections import defaultdict
import os

def evolucionar_generaciones_multinivel(
    poblacion_inicial,
    evaluar_fitness_poblacion,
    evaluar_fitness_poblacion_con_split,
    seleccionar_padres_elitismo,
    generar_nueva_generacion,
    formar_nueva_poblacion_heredada,
    n_generaciones=1000,
    tamano_poblacion=1000,
    cantidad_padres=200,
    prob_mutacion=0.1,
    ruta_log=None,
    nombre_log=None
):
    poblacion = poblacion_inicial
    historial_mejor_fitness = []
    historial_fitness_promedio = []
    historial_split_por_generacion = []

    if ruta_log:
        with open(ruta_log, "w", encoding="utf-8") as f:
            f.write(f"üìà Evoluci√≥n iniciada: {datetime.now()} {nombre_log or ''}\n\n")

    for generacion in range(n_generaciones):
        print(f"\nüöÄ Generaci√≥n {generacion + 1}/{n_generaciones}")

        fitness_poblacion = evaluar_fitness_poblacion(
            poblacion, alpha=1.0, beta=0.2, num_procesos=os.cpu_count()
        )

        # Evaluaci√≥n por split cada 50 generaciones
        if generacion % 50 == 0:
            _, splits_poblacion = evaluar_fitness_poblacion_con_split(
                poblacion, alpha=1.0, beta=0.2, num_procesos=os.cpu_count()
            )
            acumulado = defaultdict(float)
            cuenta = defaultdict(int)
            for split_dict in splits_poblacion:
                for split, valor in split_dict.items():
                    acumulado[split] += valor
                    cuenta[split] += 1
            promedio_por_split = {
                split: acumulado[split] / cuenta[split]
                for split in acumulado
            }
            historial_split_por_generacion.append(promedio_por_split)

            print(f"\nüìä Resumen fitness por nivel:")
            for nivel, score in promedio_por_split.items():
                print(f"  ‚û§ {nivel}: {score:.4f}")

            if ruta_log:
                with open(ruta_log, "a", encoding="utf-8") as f:
                    f.write(f"\nüìä Nivel por split - Gen {generacion+1} {nombre_log or ''}:\n")
                    for nivel, score in promedio_por_split.items():
                        f.write(f"  ‚û§ {nivel}: {score:.4f}\n")

        # Estad√≠sticas principales
        mejor_fitness = max(fitness_poblacion)
        fitness_promedio = sum(fitness_poblacion) / len(fitness_poblacion)
        historial_mejor_fitness.append(mejor_fitness)
        historial_fitness_promedio.append(fitness_promedio)

        print(f"‚≠ê Mejor fitness: {mejor_fitness:.6f}")
        print(f"üìä Fitness promedio: {fitness_promedio:.6f}")

        if ruta_log:
            with open(ruta_log, "a", encoding="utf-8") as f:
                f.write(f"Gen {generacion+1}: mejor = {mejor_fitness:.5f}, promedio = {fitness_promedio:.5f}\n")

        if ruta_log and (generacion + 1) % 50 == 0:
            top10 = sorted(zip(poblacion, fitness_poblacion), key=lambda x: x[1], reverse=True)[:10]
            with open(ruta_log, "a", encoding="utf-8") as f:
                f.write(f"\nüîü Top 10 {nombre_log or ''} - Gen {generacion+1}:\n")
                for i, (cromo, fit) in enumerate(top10):
                    f.write(f"#{i+1}: fitness = {fit:.5f} - genes = {len(cromo)}\n")
                    for gen in cromo[:5]:
                        f.write(f"   {gen}\n")
                f.write("\n")

        padres = seleccionar_padres_elitismo(poblacion, fitness_poblacion, cantidad_padres=cantidad_padres)
        hijos = generar_nueva_generacion(padres, prob_mutacion=prob_mutacion)
        poblacion = formar_nueva_poblacion_heredada(
            padres, hijos, tamano_poblacion_final=tamano_poblacion, prob_mutacion=prob_mutacion
        )

    return poblacion, historial_mejor_fitness, historial_fitness_promedio, fitness_poblacion, historial_split_por_generacion

## üèÜ Guardado de los 3 mejores cromosomas (Top 3 global)

Esta funci√≥n selecciona los tres mejores cromosomas de la poblaci√≥n final con base en su fitness y los guarda en archivos `.txt` individuales.

### ¬øQu√© guarda?
- La posici√≥n del cromosoma en el ranking (`#1`, `#2`, `#3`).
- Su puntaje de fitness.
- La secuencia completa de genes (asignaciones horarias).

### Par√°metros:
- `poblacion_final`: lista de cromosomas resultantes de la evoluci√≥n.
- `fitness_final`: lista de valores de fitness asociados.
- `ruta_salida_base`: carpeta donde se guardar√°n los archivos.

> üíæ Ideal para conservar las mejores soluciones y analizarlas posteriormente.


In [None]:
import os

def guardar_top3_cromosomas(poblacion_final, fitness_final, ruta_salida_base):
    top3 = sorted(zip(poblacion_final, fitness_final), key=lambda x: x[1], reverse=True)[:3]
    for i, (cromo, fit) in enumerate(top3, start=1):
        ruta_cromo = os.path.join(ruta_salida_base, f"mejor_GLOBAL_#{i}.txt")
        with open(ruta_cromo, "w", encoding="utf-8") as f:
            f.write(f"# Cromosoma top #{i} GLOBAL - fitness: {fit:.5f}\n")
            for gen in cromo:
                f.write(str(gen) + "\n")

## üìà Registro hist√≥rico de la evoluci√≥n del fitness

Esta funci√≥n almacena en un archivo `.csv` el comportamiento del fitness a lo largo de las generaciones. Incluye:
- `Fitness_Max`: mejor score de cada generaci√≥n.
- `Fitness_Prom`: score promedio de la poblaci√≥n por generaci√≥n.
- `Fitness_Min`: el menor valor entre el mejor y promedio (proxy conservador).

### Par√°metros:
- `hist_mejor`: lista con el mejor fitness por generaci√≥n.
- `hist_prom`: lista con el fitness promedio por generaci√≥n.
- `ruta_csv`: ruta del archivo donde se guarda el historial.

### Aplicaciones:
- üìä An√°lisis de convergencia del algoritmo.
- üî¨ Comparaci√≥n entre configuraciones evolutivas.
- üìâ Identificaci√≥n de estancamiento o mejora progresiva.

> üí° Este archivo es esencial para construir gr√°ficos de evoluci√≥n y evaluar la efectividad del algoritmo.


In [None]:
import pandas as pd

def guardar_evolucion_fitness(hist_mejor, hist_prom, ruta_csv):
    hist_min = [min(m, p) for m, p in zip(hist_mejor, hist_prom)]
    df = pd.DataFrame({
        "Generacion": list(range(1, len(hist_mejor) + 1)),
        "Fitness_Max": hist_mejor,
        "Fitness_Prom": hist_prom,
        "Fitness_Min": hist_min
    })
    df.to_csv(ruta_csv, index=False, encoding="utf-8")
    return df

## üß™ Ejecuci√≥n principal del algoritmo gen√©tico y guardado de resultados

Este bloque ejecuta la funci√≥n principal de evoluci√≥n `evolucionar_generaciones_multinivel` y almacena los resultados obtenidos para su posterior an√°lisis.

### ¬øQu√© hace?

1. **Inicializa los par√°metros clave**:
   - Ruta de log para seguimiento de la evoluci√≥n.
   - Nombre descriptivo del experimento (e.g., `EVOLUCI√ìN COMPLETA MULTINIVEL`).

2. **Ejecuta la evoluci√≥n** de la poblaci√≥n por 1000 generaciones:
   - Eval√∫a fitness general y por nivel.
   - Aplica selecci√≥n, crossover y mutaci√≥n.
   - Registra el historial de evoluci√≥n.

3. **Guarda los resultados**:
   - `Top 3` de los mejores cromosomas en archivos `.txt`.
   - Evoluci√≥n del fitness (`m√°ximo`, `promedio`, `m√≠nimo`) en un archivo `.csv`.

### Salidas esperadas:
- `poblacion_final`: cromosomas resultantes tras la evoluci√≥n.
- `hist_mejor`: mejor fitness por generaci√≥n.
- `hist_prom`: fitness promedio por generaci√≥n.
- `fitness_final`: fitness actual de la √∫ltima generaci√≥n.
- `split_hist`: evoluci√≥n de fitness por nivel.

> üìÅ Los resultados son guardados autom√°ticamente en la carpeta `/Tesis_MSDS/logs_evolucion` para su trazabilidad y an√°lisis posterior.


In [None]:
# ‚úÖ Definir ruta para guardar el log
ruta_log = "/content/drive/MyDrive/Tesis_MSDS/logs_evolucion/evolucion_COMPLETA.txt"
nombre_log = "[EVOLUCI√ìN COMPLETA MULTINIVEL]"

# ‚úÖ Llamar a la funci√≥n
poblacion_final, hist_mejor, hist_prom, fitness_final, split_hist = evolucionar_generaciones_multinivel(
    poblacion_inicial=poblacion_inicial,
    evaluar_fitness_poblacion=evaluar_fitness_poblacion,
    evaluar_fitness_poblacion_con_split=evaluar_fitness_poblacion_con_split,
    seleccionar_padres_elitismo=seleccionar_padres_elitismo,
    generar_nueva_generacion=generar_nueva_generacion,
    formar_nueva_poblacion_heredada=formar_nueva_poblacion_heredada,
    n_generaciones=1000,
    tamano_poblacion=100,
    cantidad_padres=20,
    prob_mutacion=0.1,
    ruta_log=ruta_log,
    nombre_log=nombre_log
)
# ‚úÖ Guardar resultados e hist√≥rico
guardar_top3_cromosomas(poblacion_final, fitness_final, "/content/drive/MyDrive/Tesis_MSDS/logs_evolucion")
ruta_csv_fitness = "/content/drive/MyDrive/Tesis_MSDS/logs_evolucion/evolucion_fitness.csv"
df_fitness = guardar_evolucion_fitness(hist_mejor, hist_prom, ruta_csv_fitness)

[1;30;43mStreaming output truncated to the last 5000 lines.[0m

üöÄ Generaci√≥n 55/1000
‚≠ê Mejor fitness: 0.833333
üìä Fitness promedio: 0.016662
üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.

üöÄ Generaci√≥n 56/1000
‚≠ê Mejor fitness: 0.833333
üìä Fitness promedio: 0.016486
üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.

üöÄ Generaci√≥n 57/1000
‚≠ê Mejor fitness: 0.833333
üìä Fitness promedio: 0.016471
üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.

üöÄ Generaci√≥n 58/1000
‚≠ê Mejor fitness: 0.833333
üìä Fitness promedio: 0.016407
üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.

üöÄ Generaci√≥n 59/1000
‚≠ê Mejor fitness: 0.833333
üìä Fitness promedio: 0.016492
üîÑ Generando 60 individuos adicionales con crossover entre padres para completar la poblaci√≥n.

üöÄ Generaci√


# üß¨ Pipeline del Algoritmo Gen√©tico para Generaci√≥n de Horarios Escolares

Este pipeline resume la implementaci√≥n completa del algoritmo gen√©tico personalizado para resolver el **Educational Course Timetabling Problem (ECTP)** en el contexto del Colegio Lev Vygotsky. Se detalla el flujo modular del c√≥digo en etapas funcionales.

---

## 1. üéØ Montaje de entorno y carga de datos
- Montaje de Google Drive.
- Lectura de archivos CSV: docentes, materias, paralelos, horarios.

## 2. üßº Preprocesamiento de datos
- Unificaci√≥n de docentes (e.g., ingl√©s y educaci√≥n f√≠sica).
- Normalizaci√≥n de c√≥digos y separaci√≥n por materia.
- Generaci√≥n del diccionario `dic_profesores`.

## 3. üß† Reglas de negocio y validaci√≥n horaria
- Definici√≥n de restricciones duras por recesos, almuerzos, clubs, evaluaciones.
- Validaci√≥n de horarios disponibles (`es_horario_valido`).

## 4. üß± Generaci√≥n de cromosomas
- Asignaci√≥n de bloques sincronizados (e.g., INGL√âS, EST, DES).
- Inserci√≥n de pares de materias preferidas (DER‚ÄìCOM, SPE‚ÄìINV, etc.).
- Relleno final con asignaciones aleatorias v√°lidas.

## 5. üß¨ Evaluaci√≥n de fitness
- Penalizaciones por:
  - Discontinuidad.
  - M√°s de 3 horas seguidas.
  - Cruces docentes.
  - Restricciones blandas (medio tiempo, maternidad).
- Fitness global y desagregado por nivel (`fitness_con_split`).

## 6. üå± Evoluci√≥n poblacional
- Generaci√≥n de poblaci√≥n inicial (opcionalmente desde cromosoma hist√≥rico).
- Selecci√≥n de √©lite.
- Crossover h√≠brido heur√≠stico.
- Mutaci√≥n por intercambio dentro de nivel.
- Formaci√≥n de nueva poblaci√≥n respetando los mejores individuos.

## 7. üìä Trazabilidad y visualizaci√≥n
- Log de evoluci√≥n generaci√≥n por generaci√≥n.
- Registro del top 3 final.
- Exportaci√≥n del historial de fitness a CSV.

## 8. üßæ Verificaci√≥n final
- Conteo de horas por materia y aula.
- Reporte de materias faltantes.
- Evaluaci√≥n de pares contiguos v√°lidos insertados.

---

> üß™ Este pipeline permite experimentar con distintas configuraciones del algoritmo y facilita la trazabilidad completa del proceso evolutivo.



