In [13]:
import pandas as pd

# CONFIGURACIÓN

In [33]:
# 1. Comportamiento:
LIMITE_POR_GRUPO = 70
TOLERANCIA = 2
TOLERANCIA_ACTIVADA = True
NUMERO_GRUPOS = 70
CURSO_HORA_SIN_ASIGNAR = 'Sin asignar' # Si queda algún grupo sin asignarle horario
GENERACION_CURSOS_AUTOMATICA = False # Si se establece como False es necesario poner el número de grupos manualmente más abajo
JORNADAS_AUTOMATICAS = False # Si se establece como False es necesario poner la distribución por jornadas manualmente más abajo
# Estrategias existentes: BALANCEADO_PURO, LLENAR
ESTRATEGIA = 'LLENAR' 

# 2. Toma de datos:
COLUMNA_DISP_PROGRAMACION = 'DISP_PROGRAMACION'
COLUMNA_DISP_INGLES = 'DISP_INGLES'
COLUMNA_DISP_COACH = 'DISP_COACHING'
COLUMNA_NIVEL_ESTUDIO = 'NIVEL_EDUCATIVO_AGRUPADO'


# x. Asignaturas a tener en cuenta. 
#    Formato: nombre (llave) => código de sistema académico, tipo (1 para horario unido, 2 para granular).
ASIGNATURAS = {
    'PYTHON': {
        'codigo': 'A',
        'tipo': 1        
    },
    'INGLES 1': {
        'codigo': 'M',
        'tipo': 2
    },
    'COACH 1': {
        'codigo': 'N',
        'tipo': 2
    }
}

# x. Codificación de los horarios. Estos deben de coincidir en el formato con el que se alimenta el software.
#    Franjas unidas se us
FRANJAS_UNIDAS = {
    'MAÑANA': [
        'Jornada de la mañana (6 a.m. a 8 a.m.)',
        'Jornada de la mañana (8 a.m. a 10 a.m.)',
        'Jornada de la mañana (10 a.m. a 12 m.)'
    ],
    'TARDE': [        
        'Jornada de la tarde (12 m. a 2 p.m.)',
        'Jornada de la tarde (2 p.m. a 4 p.m.)',
        'Jornada de la tarde (4 p.m. a 6 p.m.)'
    ],
    'NOCHE': [
        'Jornada de la noche (6 p.m. a 8 p.m.)',
        'Jornada de la noche (8 p.m. a 10 p.m.)'
    ]
}

FRANJAS_GRANULARES = {
    'MAÑANA' : [        
        'Jornada de la mañana (6 a.m. a 7 a.m.)',
        'Jornada de la mañana (7 a.m. a 8 a.m.)',
        'Jornada de la mañana (8 a.m. a 9 a.m.)',
        'Jornada de la mañana (9 a.m. a 10 a.m.)',
        'Jornada de la mañana (10 a.m. a 11 a.m.)',
        'Jornada de la mañana (11 a.m. a 12 m.)'
    ],
    'TARDE': [
        'Jornada de la tarde (12 m. a 1 p.m.)',
        'Jornada de la tarde (1 p.m. a 2 p.m.)',
        'Jornada de la tarde (2 p.m. a 3 p.m.)',
        'Jornada de la tarde (3 p.m. a 4 p.m.)',
        'Jornada de la tarde (4 p.m. a 5 p.m.)',
        'Jornada de la tarde (5 p.m. a 6 p.m.)',
    ],
    'NOCHE': [
        'Jornada de la noche (6 p.m. a 7 p.m.)',
        'Jornada de la noche (7 p.m. a 8 p.m.)',
        'Jornada de la noche (8 p.m. a 9 p.m.)',
        'Jornada de la noche (9 p.m. a 10 p.m.)'
    ]
}

# x. Número de grupos por jornada. Debe de coincidir con el número de grupos a crear.
#    Este campo permite cambiar la distribución de los grupos en las jornadas.
JORNADAS = {
    'MAÑANA': 22,
    'TARDE': 12,
    'NOCHE': 36
}

JORNADAS_MANUALES = {
    'PYTHON': {
        'MAÑANA': 22,
        'TARDE': 12,
        'NOCHE': 36
    },
    'INGLES 1': {
        'MAÑANA': 24,
        'TARDE': 19,
        'NOCHE': 27
    },
    'COACH 1': {
        'MAÑANA': 22,
        'TARDE': 23,
        'NOCHE': 25
    }
}

# x. Número de grupos manuales. El tipo de franja horaria debe de coincidir con el definido en ASIGNATURAS.
#    Debe existir un diccionario por asignatura que contenga cada jornada, la cual contiene una lista de tuplas.
#    Donde el primer elemento es la franja horaria y el segundo la cantidad.
#    Para estimar la cantidad de grupos se puede usar el Script Indagador. Los grupos deben de coincidir con la
#    distribución definida (ya sea que esté en automático o manual)

CURSOS_MANUALES = {
    'PYTHON': {
        'MAÑANA': [
            ('Jornada de la mañana (6 a.m. a 8 a.m.)', 9),
            ('Jornada de la mañana (8 a.m. a 10 a.m.)', 8),
            ('Jornada de la mañana (10 a.m. a 12 m.)', 5)
        ],
        'TARDE': [
            ('Jornada de la tarde (12 m. a 2 p.m.)', 3),
            ('Jornada de la tarde (2 p.m. a 4 p.m.)', 4),
            ('Jornada de la tarde (4 p.m. a 6 p.m.)', 5)
        ],
        'NOCHE': [
            ('Jornada de la noche (6 p.m. a 8 p.m.)', 18),
            ('Jornada de la noche (8 p.m. a 10 p.m.)', 18)
        ]
    },
    'INGLES 1': {
        'MAÑANA': [
            ('Jornada de la mañana (6 a.m. a 7 a.m.)', 7),
            ('Jornada de la mañana (7 a.m. a 8 a.m.)', 6),
            ('Jornada de la mañana (8 a.m. a 9 a.m.)', 0),
            ('Jornada de la mañana (9 a.m. a 10 a.m.)', 6),
            ('Jornada de la mañana (10 a.m. a 11 a.m.)', 0),
            ('Jornada de la mañana (11 a.m. a 12 m.)', 5)
        ],
        'TARDE': [
            ('Jornada de la tarde (12 m. a 1 p.m.)', 5),
            ('Jornada de la tarde (1 p.m. a 2 p.m.)', 5),
            ('Jornada de la tarde (2 p.m. a 3 p.m.)', 3),
            ('Jornada de la tarde (3 p.m. a 4 p.m.)', 0),
            ('Jornada de la tarde (4 p.m. a 5 p.m.)', 0),
            ('Jornada de la tarde (5 p.m. a 6 p.m.)', 6)
        ],
        'NOCHE': [
            ('Jornada de la noche (6 p.m. a 7 p.m.)', 5),
            ('Jornada de la noche (7 p.m. a 8 p.m.)', 7),
            ('Jornada de la noche (8 p.m. a 9 p.m.)', 10),
            ('Jornada de la noche (9 p.m. a 10 p.m.)', 5)
        ]
    },
    'COACH 1': {
        'MAÑANA': [
            ('Jornada de la mañana (6 a.m. a 7 a.m.)', 5),
            ('Jornada de la mañana (7 a.m. a 8 a.m.)', 4),
            ('Jornada de la mañana (8 a.m. a 9 a.m.)', 5),
            ('Jornada de la mañana (9 a.m. a 10 a.m.)', 2),
            ('Jornada de la mañana (10 a.m. a 11 a.m.)', 4),
            ('Jornada de la mañana (11 a.m. a 12 m.)', 2)
        ],
        'TARDE': [
            ('Jornada de la tarde (12 m. a 1 p.m.)', 4),
            ('Jornada de la tarde (1 p.m. a 2 p.m.)', 5),
            ('Jornada de la tarde (2 p.m. a 3 p.m.)', 2),
            ('Jornada de la tarde (3 p.m. a 4 p.m.)', 4),
            ('Jornada de la tarde (4 p.m. a 5 p.m.)', 4),
            ('Jornada de la tarde (5 p.m. a 6 p.m.)', 4)
        ],
        'NOCHE': [
            ('Jornada de la noche (6 p.m. a 7 p.m.)', 6),
            ('Jornada de la noche (7 p.m. a 8 p.m.)', 4),
            ('Jornada de la noche (8 p.m. a 9 p.m.)', 6),
            ('Jornada de la noche (9 p.m. a 10 p.m.)', 9)
        ]
    }
}

# PROCESAMIENTO

In [15]:
# INICIALIZACIÓN DE DICCIONARIOS AUXILIARES
FRANJAS_PROGRAMACION = {}
FRANJAS_INGLES_COACH = {}
TRADUCTOR_PROGRAMACION = {}
TRADUCTOR_INGLES_COACH = {}
i = 0
for jornada in FRANJAS_GRANULARES.values():
    for franja in jornada:        
        FRANJAS_INGLES_COACH[franja] = i
        TRADUCTOR_INGLES_COACH[i] = franja
        i += 1
i = 0
for jornada in FRANJAS_UNIDAS.values():
    for franja in jornada:
        tupla = (i, i+1)
        FRANJAS_PROGRAMACION[franja] = tupla
        TRADUCTOR_PROGRAMACION[tupla] = franja
        i += 2

In [60]:
# Se le pasa cada cadena de columna de jornadas, retorna una lista con los códigos de franja
def tokenizarAsignado(cadena, separador, conjunto):
    horas = cadena.split(separador)
    rta = []
    for hora in horas:
        if hora in conjunto:
            rta.append(conjunto[hora])
    return rta
def inicializarCursos(inicio, numero, codigo, jornada, tipo):
    cursos = {}
    if tipo == 1:
        franjas = FRANJAS_UNIDAS[jornada]
    else:
        franjas = FRANJAS_GRANULARES[jornada]
    cantidadFranjas = len(franjas)
    for i in range (inicio, numero):
        nombre = codigo + str(i)
        cursos[nombre] = {}
        cursos[nombre]['cantidad'] = 0
        cursos[nombre]['escolaridad'] = {}
        cursos[nombre]['horario'] = franjas[i % cantidadFranjas] if GENERACION_CURSOS_AUTOMATICA else CURSO_HORA_SIN_ASIGNAR
    return cursos
def inicializarJornadas(asignatura, codigo, tipo):
    num = 1
    jornadas = {}
    conjunto = JORNADAS if JORNADAS_AUTOMATICAS else JORNADAS_MANUALES[asignatura]
    for jornada, dist in conjunto.items():
        jornadas[jornada] = inicializarCursos(num, dist + num, codigo, jornada, tipo)
        num += dist        
    return jornadas
def inicializarAsignaturas():
    grupos = {}
    for nombre, datos in ASIGNATURAS.items():
        grupos[nombre] = inicializarJornadas(nombre, datos['codigo'], datos['tipo'])
    return grupos
def asignarHorarios():
    for asignatura, jornadas in CURSOS_MANUALES.items():
        i = 1
        for jornada, lista in jornadas.items():
            prefijoCodigo = ASIGNATURAS[asignatura]['codigo']
            tipo = ASIGNATURAS[asignatura]['tipo']
            for hora, cantidad in lista:
                for j in range (i, cantidad + i):
                    codigo = prefijoCodigo + str(j)
                    GRUPOS[asignatura][jornada][codigo]['horario'] = hora
                    i += 1
                

In [48]:
DATOS = pd.read_excel('./INPUT/GRUPOS/CONSOLIDADO_DATOS_IMPORTANTES.xlsx', engine='openpyxl')

In [52]:
def permutar(listaProgramacion, listaIngles, listaCoach):
    for horaInicio, horaFin in listaProgramacion:
        for horaIngles in listaIngles:
            if horaIngles < horaInicio or horaIngles > horaFin:
                for horaCoach in listaCoach:
                    if horaCoach != horaIngles and (horaCoach < horaInicio or horaCoach > horaFin):
                        return (horaInicio, horaFin), horaIngles, horaCoach
    return -1
def todasPermutaciones(listaProgramacion, listaIngles, listaCoach):
    rta = []
    cant = len(listaProgramacion)
    nuevaLista = listaProgramacion.copy()
    while cant > 0:
        res = permutar(nuevaLista, listaIngles, listaCoach)
        if res != -1:
            rta.append(res)
        nuevaLista.pop(0)
        cant -= 1
    return rta

def determinarHoraTextoCurso(idCurso, tipo):
    if tipo == 1:
        traductor = TRADUCTOR_PROGRAMACION
    else:
        traductor = TRADUCTOR_INGLES_COACH
    
    return traductor[idCurso]

def determinarJornada(idCurso, tipo):
    if tipo == 1:
        conjunto = FRANJAS_UNIDAS
    else:
        conjunto = FRANJAS_GRANULARES
    
    nombreCurso = determinarHoraTextoCurso(idCurso, tipo)  
    for jornada in conjunto:        
        if nombreCurso in conjunto[jornada]:
            return jornada

def menorCursoPorCodigo(asignatura, jornada, idCurso, tipo):
    costoMinimo = LIMITE_POR_GRUPO * 2
    nombreCursoMinimo = -1
    ultimo = -1
    horaCursoActual = determinarHoraTextoCurso(idCurso, tipo)
    for codigo, datos in GRUPOS[asignatura][jornada].items():
        if datos['horario'] == horaCursoActual:
            ultimo = codigo
            cantidad = datos['cantidad']
            if cantidad < costoMinimo and cantidad < LIMITE_POR_GRUPO + (TOLERANCIA if TOLERANCIA_ACTIVADA else 0):
                costoMinimo = cantidad
                nombreCursoMinimo = codigo
    if nombreCursoMinimo == -1:
        raise Exception('Los cursos de la asignatura', asignatura, 'en el horario', horaCursoActual, 'están llenos.', 'Último grupo intentado:', ultimo)
    return nombreCursoMinimo, costoMinimo

# Debe de llegarle una lista de asignaturas con un mapeado a modo de tupla (nombreAsignatura, tipo) que sea de igual
# longitud que la tupla emparejamientos
def menorCostoCurso(asignaturas, emparejamientos):
    costoMinimo = 100000
    codigosMinimos = -1
    jornadasMinimas = -1
    emparejamientoMinimo = -1
    for emparejamiento in emparejamientos:
        i = 0        
        costoActual = 0
        codigos = []
        jornadas = []
        for idCurso in emparejamiento:
            nombreAsignatura, tipoAsignatura = asignaturas[i]
            jornada = determinarJornada(idCurso, tipoAsignatura)
            codigoCurso, costo = menorCursoPorCodigo(nombreAsignatura, jornada, idCurso, tipoAsignatura)
            costoActual += costo
            jornadas.append(jornada)
            codigos.append(codigoCurso)
            i += 1
        if costoActual < costoMinimo:
            costoMinimo = costoActual
            codigosMinimos = codigos
            jornadasMinimas = jornadas
            emparejamientoMinimo = emparejamiento
    return codigosMinimos, jornadasMinimas, emparejamientoMinimo

def buscarCursoSinLlenar(asignatura, jornada, idCurso, tipo):
    cursosValidosLlenos = []
    horaCursoActual = determinarHoraTextoCurso(idCurso, tipo)
    for codigo, datos in GRUPOS[asignatura][jornada].items():
        if datos['horario'] == horaCursoActual:            
            if datos['cantidad'] < LIMITE_POR_GRUPO:
                return codigo, horaCursoActual
            else:
                cursosValidosLlenos.append((codigo, horaCursoActual, datos['cantidad']))
    if TOLERANCIA_ACTIVADA:
        for codigo, hora, cantidad in cursosValidosLlenos:
            if cantidad < LIMITE_POR_GRUPO + TOLERANCIA:
                return codigo, hora
    # Si todos están llenos para la hora buscada, devuelve -1
    return -1, horaCursoActual         
    
def asignamientoNaive(asignaturas, emparejamientos):
    # [((12, 13), 15, 14)]
    horaCursoActual = -1
    ultimo = -1
    for emparejamiento in emparejamientos:
        # ((12, 13), 15, 14)
        i = 0
        codigos = []
        jornadas = []
        for idCurso in emparejamiento:
            # (12,13)
            nombreAsignatura, tipoAsignatura = asignaturas[i]
            jornada = determinarJornada(idCurso, tipoAsignatura)
            codigo, horaCursoActual = buscarCursoSinLlenar(nombreAsignatura, jornada, idCurso, tipoAsignatura)
            if codigo == -1:
                ultimo = nombreAsignatura
                break
            codigos.append(codigo)
            jornadas.append(jornada)
            i += 1
        if len(codigos) == 3:
            return codigos, jornadas, emparejamiento
    if len(emparejamientos) > 0:        
        raise Exception('Todos los cursos para el horario ', horaCursoActual, 'están llenos. Último curso analizado: ', ultimo)
    return -1, horaCursoActual, ultimo
    

In [19]:
# Test de permutación
# Se asume que todas las materias se ven una vez por día
# Programación 2 horas dia
# Inglés 1 hora dia
# Coach 1 hora dia
ip = 4
programacion = tokenizarAsignado(datos[COLUMNA_DISP_PROGRAMACION][ip], ';', FRANJAS_PROGRAMACION)
ingles = tokenizarAsignado(datos[COLUMNA_DISP_INGLES][ip], ';', FRANJAS_INGLES_COACH)
coach = tokenizarAsignado(datos[COLUMNA_DISP_COACH][ip], ';', FRANJAS_INGLES_COACH)
print (programacion)
print (ingles)
print (coach)

[(12, 13), (14, 15)]
[14, 15, 13]
[12, 13, 14]


In [20]:
permutar(programacion, ingles, coach)

((12, 13), 15, 14)

In [21]:
todasPermutaciones(programacion, ingles, coach)

[((12, 13), 15, 14), ((14, 15), 13, 12)]

In [68]:
columnaNueva = []
# Inicializado de los grupos
GRUPOS = inicializarAsignaturas()
if not GENERACION_CURSOS_AUTOMATICA:
    asignarHorarios()
totales = 0
totalesSupuestosInscritos = 0
copiaDatos = DATOS.copy()
if ESTRATEGIA == 'LLENAR':
    copiaDatos.sort_values(by=[COLUMNA_NIVEL_ESTUDIO], inplace = True)
for index, row in copiaDatos.iterrows():
    listaProgramacion = tokenizarAsignado(row[COLUMNA_DISP_PROGRAMACION], ';', FRANJAS_PROGRAMACION)
    listaIngles = tokenizarAsignado(row[COLUMNA_DISP_INGLES], ';', FRANJAS_INGLES_COACH)
    listaCoach = tokenizarAsignado(row[COLUMNA_DISP_COACH], ';', FRANJAS_INGLES_COACH)
    permutaciones = todasPermutaciones(listaProgramacion, listaIngles, listaCoach)
    ciclo = [ # EL CICLO SE DEBE DETERMINAR MEDIANTE ALGÚN MECANISMO
        ('PYTHON', 1),
        ('INGLES 1', 2),
        ('COACH 1', 2)
    ]
    if ESTRATEGIA == 'BALANCEADO_PURO':        
        cursos, jornadas, _ = menorCostoCurso(ciclo, permutaciones)
    elif ESTRATEGIA == 'LLENAR':
        cursos, jornadas, _ = asignamientoNaive(ciclo, permutaciones)
    if cursos != -1:
        i = 0
        for asignatura, tipo in ciclo:            
            GRUPOS[asignatura][jornadas[i]][cursos[i]]['cantidad'] += 1
            nivelEstudio = row[COLUMNA_NIVEL_ESTUDIO]
            if nivelEstudio in GRUPOS[asignatura][jornadas[i]][cursos[i]]['escolaridad']:
                GRUPOS[asignatura][jornadas[i]][cursos[i]]['escolaridad'][nivelEstudio] += 1
            else:
                GRUPOS[asignatura][jornadas[i]][cursos[i]]['escolaridad'][nivelEstudio] = 1            
            i += 1
        columnaNueva.append(' '.join(cursos))
        totalesSupuestosInscritos += 1
    totales += 1

In [69]:
GRUPOS

{'PYTHON': {'MAÑANA': {'A1': {'cantidad': 70,
    'escolaridad': {'BACHILLER': 70},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A2': {'cantidad': 70,
    'escolaridad': {'BACHILLER': 70},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A3': {'cantidad': 70,
    'escolaridad': {'BACHILLER': 70},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A4': {'cantidad': 70,
    'escolaridad': {'BACHILLER': 22, 'PROFESIONAL+': 48},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A5': {'cantidad': 70,
    'escolaridad': {'PROFESIONAL+': 70},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A6': {'cantidad': 70,
    'escolaridad': {'PROFESIONAL+': 70},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A7': {'cantidad': 70,
    'escolaridad': {'PROFESIONAL+': 41, 'TÉCNICO': 29},
    'horario': 'Jornada de la mañana (6 a.m. a 8 a.m.)'},
   'A8': {'cantidad': 70,
    'escolaridad': {'TÉCNICO': 70},
    'horario': 'Jorn

In [83]:
# Conteo de grupos NO vacíos
contFranja = {}
nivelesEscolaresMaximos = []
for asignatura, jornadas in GRUPOS.items():
    contFranja[asignatura] = {}
    contEst = 0
    for jornada, cursos in jornadas.items():        
        for curso, datos in cursos.items():
            if datos['cantidad'] > 0:
                contEst += datos['cantidad']
                if datos['horario'] in contFranja[asignatura]:
                    contFranja[asignatura][datos['horario']] += 1
                else:
                    contFranja[asignatura][datos['horario']] = 1
                if ASIGNATURAS[asignatura]['tipo'] == 1:                    
                    niveles = [cantidad for cantidad in datos['escolaridad'].values()]
                    indice = max(niveles)/datos['cantidad']
                    nivelesEscolaresMaximos.append(indice)
                    if len(datos['escolaridad']) > 1:
                        print (curso, 'Es híbrido con un índice de', indice)
    print ('Total estudiantes en', asignatura, contEst)

A4 Es híbrido con un índice de 0.6857142857142857
A7 Es híbrido con un índice de 0.5857142857142857
A10 Es híbrido con un índice de 0.9722222222222222
A11 Es híbrido con un índice de 0.9722222222222222
A12 Es híbrido con un índice de 0.9859154929577465
A13 Es híbrido con un índice de 0.6
A16 Es híbrido con un índice de 0.9571428571428572
A19 Es híbrido con un índice de 0.7285714285714285
A20 Es híbrido con un índice de 0.9714285714285714
A23 Es híbrido con un índice de 0.9571428571428572
A24 Es híbrido con un índice de 0.8285714285714286
A27 Es híbrido con un índice de 0.7571428571428571
A28 Es híbrido con un índice de 0.6285714285714286
A31 Es híbrido con un índice de 0.6714285714285714
A33 Es híbrido con un índice de 0.5857142857142857
A35 Es híbrido con un índice de 0.9859154929577465
A39 Es híbrido con un índice de 0.8142857142857143
A48 Es híbrido con un índice de 0.8142857142857143
A56 Es híbrido con un índice de 0.6714285714285714
A62 Es híbrido con un índice de 0.74285714285714

In [82]:
suma = 0
for franja, valor in contFranja['PYTHON'].items():
    suma += valor
    print (franja + ':', valor)
print ('Total cursos', suma)
print ('Índice de homogeneidad', sum(nivelesEscolaresMaximos)/len(nivelesEscolaresMaximos))

Jornada de la mañana (6 a.m. a 8 a.m.): 9
Jornada de la mañana (8 a.m. a 10 a.m.): 8
Jornada de la mañana (10 a.m. a 12 m.): 4
Jornada de la tarde (12 m. a 2 p.m.): 3
Jornada de la tarde (2 p.m. a 4 p.m.): 4
Jornada de la tarde (4 p.m. a 6 p.m.): 5
Jornada de la noche (6 p.m. a 8 p.m.): 18
Jornada de la noche (8 p.m. a 10 p.m.): 14
Total cursos 65
Índice de homogeneidad 0.9371734681593835


In [85]:
print ('Estudiantes procesados', totales)
print ('Estudiantes procesados con cursos asignados', totales)

Estudiantes procesados 4654
Estudiantes procesados con cursos asignados 4654
