In [None]:
import pandas as pd
import random

# Cargar los datos
docentes = pd.read_csv("docentes.csv")
materias = pd.read_csv("materias.csv")
paralelos = pd.read_csv("paralelos.csv")
horarios = pd.read_csv("horarios.csv")

### üßπ 1. Unificaci√≥n de docentes de Ingl√©s

Este bloque estandariza los docentes que dictan Ingl√©s a partir de 7mo EGB. Se eliminan los registros de las docentes "ELIZABETH PUGA" y "SIMONE AYALA", y se reemplaza a "DAISY HERRERA" por el identificador gen√©rico `"INGLES ESPECIAL"`.

Este paso facilita la asignaci√≥n conjunta de horarios en niveles superiores donde el docente de ingl√©s es compartido entre paralelos.


In [None]:
#Unificar docentes de ingl√©s a partir de 7mo EGB
docentes=docentes.drop(docentes[docentes['Nombres']=='ELIZABETH PUGA'].index)
docentes=docentes.drop(docentes[docentes['Nombres']=='SIMONE AYALA'].index)
docentes["Nombres"] = docentes["Nombres"].replace("DAISY HERRERA", "INGLES ESPECIAL")



### üèÉ 2. Unificaci√≥n de docentes de Educaci√≥n F√≠sica

De forma similar, se agrupan los docentes de Educaci√≥n F√≠sica a partir de 3ro EGB. Se eliminan "CARLOS MORALES" e "IV√ÅN MALDONADO" y se reemplaza a "NANCY LINCANGO" por `"EF ESPECIAL"`.

Esto permite manejar la materia como una asignaci√≥n especial compartida, lo cual es fundamental para las restricciones del modelo de horarios.


In [None]:
#Unificar docentes de Educaci√≥n F√≠sica a partir de 3ro EGB
docentes=docentes.drop(docentes[docentes['Nombres']=='CARLOS MORALES'].index)
docentes=docentes.drop(docentes[docentes['Nombres']=='IV√ÅN MALDONADO'].index)
docentes["Nombres"] = docentes["Nombres"].replace("NANCY LINCANGO", "EF ESPECIAL")

docentes.reset_index()

### üîÑ 3. Normalizaci√≥n y expansi√≥n de c√≥digos en `docentes`

Se crea una copia del DataFrame original y se limpia la columna `Codigo` eliminando los caracteres `{}`, `'`, que provienen del formato original del set de datos.

Luego, se separan los m√∫ltiples c√≥digos almacenados en una sola celda (separados por comas) y se expande cada c√≥digo a una fila distinta mediante `explode()`.

Esto permite trabajar con asignaciones individuales por fila, una estructura m√°s adecuada para algoritmos evolutivos que requieren el an√°lisis granular de clases por docente.


In [None]:
df=docentes.copy()
# Limpiar la columna 'Codigo': eliminar llaves y comillas simples
df["Codigo"] = df["Codigo"].str.replace(r"[{}']", "", regex=True)

# Separar los c√≥digos por coma y expandir en filas individuales
docentes = df.assign(Codigo=df["Codigo"].str.split(", ")).explode("Codigo")

### üß† 4. Construcci√≥n del diccionario de asignaci√≥n docente (`dic_profesores`)

Este bloque itera sobre cada fila del DataFrame `docentes` y construye un diccionario llamado `dic_profesores` con el siguiente mapeo:

```python
{ c√≥digo_materia ‚Üí nombre_docente }


In [None]:
df=docentes.copy()
# Carga del archivo CSV
df = docentes

# Identifica las columnas
col_codigo = 'Codigo'
col_profesor = 'Nombres'

# Diccionario resultado
dic_profesores = {}

for _, row in df.iterrows():
    raw = row[col_codigo]
    if pd.isna(raw):
        continue

    # Convertimos a cadena y eliminamos espacios exteriores
    s = str(raw).strip()

    # Si empieza por '{' o '[' acabamos quitando delimitadores
    if s.startswith('{') and s.endswith('}'):
        # Quitamos las llaves
        s = s[1:-1]
    elif s.startswith('[') and s.endswith(']'):
        # Quitamos los corchetes
        s = s[1:-1]

    # Ahora s es algo como "'LEC_1EGB', 'LEC_3EGB', 'LEC_2EGB'"
    # Partimos por comas y limpiamos comillas
    codes = []
    for part in s.split(','):
        part = part.strip().strip("'\"")  # quita comillas simples o dobles
        if part:
            codes.append(part)

    # Asociamos cada c√≥digo con el profesor
    for code in codes:
        dic_profesores[code] = row[col_profesor]

# Ejemplo de uso:
for ejemplo in ['LEN_3EGB', 'PEN_10EGB', 'EST_10EGB']:
    prof = dic_profesores.get(ejemplo, 'No encontrado')
    print(f"Profesor de {ejemplo}: {prof}")

Profesor de LEN_3EGB: SOF√çA Y√âPEZ
Profesor de PEN_10EGB: MIREYA BRITO
Profesor de EST_10EGB: JONATHAN CASTRO


In [None]:
materias.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 299 entries, 0 to 298
Data columns (total 4 columns):
 #   Column    Non-Null Count  Dtype 
---  ------    --------------  ----- 
 0   Materias  299 non-null    object
 1   Nivel     299 non-null    object
 2   C√≥digo    299 non-null    object
 3   Horas     299 non-null    int64 
dtypes: int64(1), object(3)
memory usage: 9.5+ KB


### ‚ö†Ô∏è 5. Evaluaci√≥n de restricciones duras (`evaluar_restricciones_duras`)

Esta funci√≥n penaliza cromosomas que incumplen las restricciones duras del problema de horarios. Se basa en la estructura `(nivel, aula, d√≠a, hora, materia, docente)` y retorna una suma de penalizaciones acumuladas.

#### üìå Subrestricciones implementadas:

1. **Sesiones no continuas innecesarias:**
   - Si una materia tiene m√°s de una hora semanal y aparece separada por m√°s de 2 bloques en un mismo d√≠a, se penaliza (0.1 puntos por interrupci√≥n).
   - Excluye materias que aparecen por primera vez o cambian de d√≠a.

2. **M√°s de 3 horas continuas de una misma materia:**
   - Si una materia aparece en m√°s de 3 bloques seguidos dentro del mismo d√≠a, se penaliza (+2 puntos).
   - Excepciones espec√≠ficas para `MAT_1EGB`, `LEN_1EGB`, y `MAT_2EGB`.

3. **Cruces docentes en el mismo horario:**
   - Si un docente aparece asignado a m√°s de un paralelo en el mismo bloque horario (d√≠a y hora), se penaliza con +5 puntos por cada conflicto adicional.
   - Se aplican excepciones para:
     - `"EF ESPECIAL"` y `"INGLES ESPECIAL"`
     - `"JONATHAN CASTRO"` y `"JANETH MELO"` en `3BGU`
     - `"CIU_1BGU"` en `1BGU` y `"CIU_2BGU"` en `2BGU`

Esta evaluaci√≥n permite al algoritmo evolutivo evitar asignaciones inviables y guiar la generaci√≥n de soluciones factibles para el modelo escolar.


In [None]:
from collections import defaultdict

# Asumimos que este diccionario ya fue creado previamente
horas_por_materia = dict(zip(materias["C√≥digo"], materias["Horas"]))

def evaluar_restricciones_duras(cromosoma):
    penalizaciones = 0

    sesiones_por_materia = defaultdict(lambda: defaultdict(int))  # materia -> d√≠a -> cantidad
    sesiones_por_hora = defaultdict(list)  # (d√≠a, hora) -> lista de materias

    materia_actual = None
    dia_actual = None
    hora_anterior = None

    # 1. Verificaci√≥n de continuidad sin ordenar, aprovechando el orden del cromosoma
    for nivel, aula, dia, hora, materia, docente in cromosoma:
        dia = dia
        hora = int(hora)

        # Verificaci√≥n de continuidad
        if materia != materia_actual or dia != dia_actual:
            # reiniciamos el seguimiento
            materia_actual = materia
            dia_actual = dia
            hora_anterior = hora
        else:
            # comparaci√≥n directa, sin ordenar
            if horas_por_materia.get(materia, 0) > 1 and (hora - hora_anterior > 2):
                penalizaciones += 0.1

                # LOG de trazabilidad
                print(f"[SIN CONTINUIDAD] {materia} en {nivel}-{aula} con {docente} el d√≠a {dia} entre hora {hora_anterior} y {hora}")


            hora_anterior = hora

        # Recuento para otras restricciones
        sesiones_por_materia[materia][dia] += 1
        sesiones_por_hora[(dia, hora)].append(materia)

    # 2. Restricci√≥n: m√°s de 3 horas continuas de una misma materia
    materia_anterior = None
    dia_anterior = None
    racha_continua = 1


    for i in range(1, len(cromosoma)):
        _, _, dia_act, hora_act, materia_act, _ = cromosoma[i]
        _, _, dia_ant, hora_ant, materia_ant, _ = cromosoma[i - 1]

        if nivel == "1EGB" and (materia == "MAT_1EGB" or materia == "LEN_1EGB"):
          continue

        if nivel == "2EGB" and materia == "MAT_2EGB":
          continue

        if materia_act == materia_ant and dia_act == dia_ant and int(hora_act) == int(hora_ant) + 1:
            racha_continua += 1
            if racha_continua > 3:
                penalizaciones += 2  # penalizaci√≥n moderada por exceso de continuidad
        else:
            racha_continua = 1  # reiniciar contador si cambia la materia o no es consecutiva

    # 3. Cruces de docentes en el mismo horario (con excepciones por nombre y cargo)
    docentes_en_tiempo = defaultdict(lambda: defaultdict(set))  # (d√≠a, hora) -> docente -> set de paralelos
    cargos_docentes = dict(zip(docentes["Nombres"], docentes["Cargo"]))  # asume que 'docentes' est√° cargado

    for nivel, paralelo, dia, hora, materia, docente in cromosoma:
        # Excepciones:
        if docente in {"EF ESPECIAL", "INGLES ESPECIAL"}:
            continue
        if docente == "JONATHAN CASTRO" and nivel == "3BGU":
            continue
        if docente == "JANETH MELO" and nivel == "3BGU":
            continue
        if materia == "CIU_1BGU" and  nivel=="1BGU":
            continue
        if materia == "CIU_2BGU" and  nivel=="2BGU":
            continue

        docentes_en_tiempo[(dia, hora)][docente].add(paralelo)

    for (dia, hora), docentes_dict in docentes_en_tiempo.items():
        for docente, paralelos in docentes_dict.items():
            if len(paralelos) > 1:
                # conflicto = f"[CRUCE] Docente: {docente} asignado a paralelos {sorted(paralelos)} el d√≠a {dia}, hora {hora}"
                # print(conflicto)
                penalizaciones += 5 * (len(paralelos) - 1)  # penalizaci√≥n fuerte por cruce real




    return penalizaciones

### ‚öñÔ∏è 6. Evaluaci√≥n de restricciones blandas (`evaluar_restricciones_blandas`)

Esta funci√≥n penaliza configuraciones que afectan la calidad del horario, pero que no invalidan completamente la soluci√≥n. Las penalizaciones son m√°s suaves y permiten guiar al algoritmo evolutivo hacia horarios preferibles.

#### üìå Subrestricciones consideradas:

1. **Docentes de medio tiempo:**
   - Si un docente con contrato `"Medio tiempo"` tiene clases asignadas a partir de la hora 11 (equivale a despu√©s de las 12pm), se penaliza con +2 por cada infracci√≥n.

2. **Docentes con licencia por maternidad:**
   - Si un docente con categor√≠a `"Maternidad"` tiene clases despu√©s de la hora 14, se penaliza con +2 por cada infracci√≥n.

3. **(Reservado)**: `materias_por_dia` registra c√≥digos por d√≠a y aula, con una l√≥gica pensada para limitar la variedad de materias por d√≠a, pero esta parte a√∫n no se ejecuta completamente (puedes extenderla para nuevas restricciones blandas en el futuro).

Este tipo de evaluaci√≥n es √∫til para incorporar consideraciones humanas y operativas en el modelo, mejorando la aceptabilidad de los horarios generados.


In [None]:
def evaluar_restricciones_blandas(cromosoma):
    penalizaciones = 0

    # Crear diccionarios r√°pidos de cargos y docentes
    cargo_docente = dict(zip(docentes["Nombres"], docentes["Cargo"]))

    sesiones_por_dia_docente = defaultdict(lambda: defaultdict(list))  # docente -> d√≠a -> horas
    materias_por_dia = defaultdict(set)

    for nivel, aula, dia, hora, materia, docente in cromosoma:
        if not materia.isupper():
            continue

        # 1. Horario de medio tiempo (ma√±ana = hasta 12pm => Hora 8)
        if cargo_docente.get(docente) == "Medio tiempo" and int(hora) > 10:
            penalizaciones += 2

        # 2. Maternidad (√∫ltima hora debe ser m√°ximo la 14)
        if cargo_docente.get(docente) == "Maternidad" and int(hora) > 14:
            penalizaciones += 2


        # Registrar para posibles evaluaciones futuras
        sesiones_por_dia_docente[docente][dia].append(int(hora))

    for (aula, dia), codigos in materias_por_dia.items():
        if len(codigos) > 3:
            penalizaciones += (len(codigos) - 3)

    return penalizaciones

### üßÆ 7. Funci√≥n `fitness`: evaluaci√≥n ponderada de calidad de un cromosoma

Esta funci√≥n computa el valor de aptitud (`fitness`) de un cromosoma, combinando las penalizaciones de restricciones duras y blandas con ponderaciones ajustables.

#### ‚öôÔ∏è F√≥rmula:
$
\text{fitness} = \frac{1}{1 + (\alpha \cdot \text{penalizaciones_duras} + \beta \cdot \text{penalizaciones_blandas})}
$

#### üìå Par√°metros:
- `cromosoma`: lista de genes con estructura `(nivel, aula, d√≠a, hora, materia, docente)`.
- `alpha`: peso de las restricciones duras (por defecto 1.0).
- `beta`: peso de las restricciones blandas (por defecto 0.2).

#### üìä Resultado:
- El valor final estar√° en el rango \( (0, 1] \), donde valores cercanos a 1 indican horarios con muy pocas o ninguna violaci√≥n de restricciones.
- Se penaliza fuertemente los errores duros y suavemente los errores blandos, ajustando el balance entre factibilidad y calidad del horario.

Esta m√©trica gu√≠a el proceso evolutivo, favoreciendo individuos que respetan las condiciones fundamentales del problema y, en segundo plano, optimizan su conveniencia operativa.


In [None]:
# Funci√≥n fitness con ponderaciones para restricciones duras y blandas
def fitness(cromosoma, alpha=1.0, beta=0.2):
    penal_duras = evaluar_restricciones_duras(cromosoma)
    penal_blandas = evaluar_restricciones_blandas(cromosoma)

    penal_total = alpha * penal_duras + beta * penal_blandas
    score = 1 / (1 + penal_total)

    return score

### üìö 8. Funci√≥n `fitness_con_split`: evaluaci√≥n global y por nivel

Esta funci√≥n extiende el c√°lculo del fitness permitiendo obtener:
1. El fitness total del cromosoma.
2. El fitness individual por cada nivel educativo (EGB, BGU, etc.), √∫til para an√°lisis por subgrupo o modularizaci√≥n de la evoluci√≥n.

#### üìå Descripci√≥n de la l√≥gica:
- Se agrupan los genes del cromosoma por su campo `nivel`.
- Para cada grupo, se calcula el fitness utilizando la funci√≥n est√°ndar `fitness(...)`.
- Tambi√©n se calcula el fitness global del cromosoma completo.
- Se retorna una tupla con:
  - `fitness_total`: aptitud global considerando todo el cromosoma.
  - `fitness_por_split`: diccionario `{nivel: fitness_nivel}`.

#### üéØ Aplicaci√≥n:
Ideal para procesos de:
- **Trazabilidad**: detectar qu√© niveles est√°n peor asignados.
- **Divisi√≥n evolutiva**: evolucionar por niveles en paralelo o de forma secuencial.
- **Visualizaci√≥n por split**: generar gr√°ficas de convergencia por nivel.


In [None]:
def fitness_con_split(cromosoma, alpha=1.0, beta=0.2):
    from collections import defaultdict

    # Agrupar genes por nivel (gen[0] es el nivel)
    genes_por_nivel = defaultdict(list)
    for gen in cromosoma:
        nivel = gen[0]
        genes_por_nivel[nivel].append(gen)

    fitness_por_split = {}
    total_fitness = 0

    for nivel, subcromosoma in genes_por_nivel.items():
        # Calcular fitness del subcromosoma con funci√≥n tradicional
        score_nivel = fitness(subcromosoma, alpha=alpha, beta=beta)
        fitness_por_split[nivel] = score_nivel
    total_fitness = fitness(cromosoma)

    return total_fitness, fitness_por_split

### üìÇ 9. Funci√≥n `cargar_cromosoma_desde_txt`: lectura de cromosoma desde archivo `.txt`

Esta funci√≥n permite cargar un cromosoma previamente guardado desde un archivo `.txt`, donde cada l√≠nea representa un gen en formato de tupla:

\[
(\text{nivel}, \text{aula}, \text{d√≠a}, \text{hora}, \text{materia}, \text{docente})
\]

#### üß± L√≥gica:
- Lee el archivo l√≠nea por l√≠nea.
- Ignora l√≠neas vac√≠as.
- Convierte cada l√≠nea en una tupla Python usando `eval()` y lo agrega a una lista.
- Retorna el cromosoma completo como una lista de genes.

#### üõ†Ô∏è Aplicaciones:
- Restaurar cromosomas elite (top 1, top 3) para an√°lisis.
- Evaluar la calidad de soluciones almacenadas.
- Visualizar horarios previamente generados.


In [None]:
def cargar_cromosoma_desde_txt(nombre_archivo):
    cromosoma = []
    with open(nombre_archivo, "r", encoding="utf-8") as f:
        for linea in f:
            linea = linea.strip()
            if linea:
                cromosoma.append(eval(linea))
    return cromosoma

### üîç 10. Cargar e inspeccionar un cromosoma desde archivo

En este bloque se utiliza la funci√≥n `cargar_cromosoma_desde_txt` para leer un cromosoma almacenado en un archivo `.txt` (por ejemplo, `"Horario_LEV.txt"`).

#### üßæ Acciones realizadas:
- Se carga el cromosoma completo como lista de tuplas.
- Se imprime el total de genes (asignaciones).
- Se muestran los primeros genes para verificar su estructura y contenido.

Esto es √∫til para validar el archivo, inspeccionar asignaciones espec√≠ficas, o alimentar procesos de evaluaci√≥n, visualizaci√≥n o mutaci√≥n evolutiva.


In [None]:
cromosoma = cargar_cromosoma_desde_txt("Horario_LEV.txt")
print(f"Total de genes generados: {len(cromosoma)}")
# Mostrar los primeros 5 genes
for gen in cromosoma[:]:
    print(gen)

Total de genes generados: 2832
('1EGB', 'Ejemplares', 'Lunes', 1, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 2, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 3, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Lunes', 4, 'PEN_1EGB', 'FERNANDA CA√ëIZARES')
('1EGB', 'Ejemplares', 'Lunes', 6, 'DES_1EGB', 'ANDREA MACIAS')
('1EGB', 'Ejemplares', 'Lunes', 7, 'EDU_1EGB', 'EF ESPECIAL')
('1EGB', 'Ejemplares', 'Lunes', 8, 'EDU_1EGB', 'EF ESPECIAL')
('1EGB', 'Ejemplares', 'Lunes', 9, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 10, 'MAT_1EGB', 'PAULINA √ëACATO')
('1EGB', 'Ejemplares', 'Lunes', 13, 'DAN_1EGB', 'PAOLA L√ìPEZ')
('1EGB', 'Ejemplares', 'Lunes', 14, 'MUS_1EGB', 'LUIS J√ÅCOME')
('1EGB', 'Ejemplares', 'Martes', 1, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Martes', 2, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Martes', 3, 'LEN_1EGB', 'MALENA O√ëA')
('1EGB', 'Ejemplares', 'Martes', 4, 'EST_1EGB', 'SANTIAGO C

In [None]:
fitness_con_split(cromosoma)

[SIN CONTINUIDAD] LEN_1EGB en 1EGB-Entusiastas con MALENA O√ëA el d√≠a Martes entre hora 10 y 13
[SIN CONTINUIDAD] NAT_2EGB en 2EGB-Amistosos con MARIANA HIDALGO el d√≠a Mi√©rcoles entre hora 10 y 13
[SIN CONTINUIDAD] LEN_1EGB en 1EGB-Entusiastas con MALENA O√ëA el d√≠a Martes entre hora 10 y 13
[SIN CONTINUIDAD] NAT_2EGB en 2EGB-Amistosos con MARIANA HIDALGO el d√≠a Mi√©rcoles entre hora 10 y 13


(0.16129032258064516,
 {'1EGB': 0.9090909090909091,
  '2EGB': 0.9090909090909091,
  '3EGB': 1.0,
  '4EGB': 1.0,
  '5EGB': 1.0,
  '6EGB': 1.0,
  '7EGB': 1.0,
  '8EGB': 1.0,
  '9EGB': 1.0,
  '10EGB': 1.0,
  '1BGU': 1.0,
  '2BGU': 1.0,
  '3BGU': 1.0})