In [None]:
import pandas as pd

# <img style="float: left; padding: 0px 10px 0px 0px;" src="https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Escudo_de_la_Pontificia_Universidad_Cat%C3%B3lica_de_Chile.svg/1920px-Escudo_de_la_Pontificia_Universidad_Cat%C3%B3lica_de_Chile.svg.png"  width="140" /> **Optativos de Profundización (OPR's)**
**Licenciatura en Ingeniería en Ciencias de Datos**<br>
**Pontificia Universidad Católica de Chile**<br>
**Autor:** Matías Armando Pineda<br>
**Email:** matias.pineda@uc.cl

## Introducción:
---
Este Notebook está hecho para visualizar los optativos de profundización de la carrera, según los ramos aprobados de uno. La idea de que cualquier persona, independiente del semestre y sus ramos aprobados, pueda hacer un filtro sin tomarse la tediosa tarea de buscar cada OPR en catálogo uc.

Se espera que este Notebook acompañe a cada uno en su trayectoria académica, que sea único al igual que el usuario y sea moldeable a cada cambio que efectue la unidad académica (`IMC`).

Toda la información presentada en los archivos `.csv` que se usan en este Notebook fueron obtenidos de la página oficial de la Pontificia Universidad Católica de Chile: https://catalogo.uc.cl.

## Archivo `malla_licd.xlsx`:
---
En la carpeta `Data` adjunta a este Notebook se encuentra el archivo excel `malla_licd` con todos los ramos de la carrera, es deber del usuario modificar `EXCLUSIVAMENTE` el atributo de `aprobado` de cada ramo de la malla, en caso contrario simplemente el código va a dejar de funcionar correctamente.

Notese que los datos de cada semestre poseen más datos que los que se usarán para este Notebook, la idea es teminar de perfilar estos datos para crear más herramientas parecidas a este Notebook.

## Archivo `oprs.csv`:
---
Este archivo `.csv` guarda los datos de los optativos de profundización que se pueden elegir a lo largo de la carrera, todo `opr` presenta:
* Sigla
* Nombre
* Unidad Académica a Cargo
* Nivel (PR, MG, DT)
* Pre-requisitos 

Idealmente no modificar este archivo, cualquier actualización de este será infomado y subido al repositorio. Si se encuentra algún error en los datos, por favor contactarse a la brevedad por el mail entregado al comienzo de este Notebook.

## Carga de Data:
---

In [None]:
malla = {}
for i in range(8):
    malla[i+1] = pd.read_excel(f'Data/malla_licd.xlsx', sheet_name=f'semestre {i+1}')
    malla[i+1]['pre-requisitos'] = malla[i+1]['pre-requisitos'].apply(lambda x: x.split(',') if type(x) == str else x)
malla[1]

In [None]:
oprs = pd.read_csv('Data/oprs.csv')
oprs['pre-requisitos'] = oprs['pre-requisitos'].apply(lambda x: x.split(','))
oprs.head()

## Búsqueda de OPR's:
---
Recuerde que este código sólo entrega los ramos que se puede optar según los ramos aprobados guardados en la carpeta `Malla`.

In [None]:
def search_oprs(oprs: pd.DataFrame, cursos: dict):
    # Ramos Aprobados
    aprob = []
    for i in range(8):
        for j in range(4):
            if cursos[i+1].iloc[j]['aprobado']:
                aprob.append(cursos[i+1].iloc[j]['sigla'])
    
    # Indices de Ramos que no se pueden tomar
    cant = []
    for i in range(oprs.shape[0]):
        for ramo in oprs.iloc[i]['pre-requisitos']:
            if ramo not in aprob and ramo != 'No tiene':
                cant.append(i)
                break
    
    df = oprs.copy()
    df.drop(index=cant, inplace=True)

    # Se entrega el DataFrame final con los ramos que se puede tomar
    return df

# Resultado
search_oprs(oprs, malla)