In [None]:
import locale
import numpy as np
import os
import pandas as pd
import tempfile
from datetime import datetime
from fdfgen import forge_fdf
from pathlib import Path
from tqdm.notebook import tqdm

# üëá Configuraci√≥n

In [None]:
CURSO = 'CF GA'                       # 1ESO, 2ESO, 3ESO, 3PMAR, 4ESO, 1BACH, 2BACH, FPB SA, CF AD, CF GA, CF COM
DESDE = datetime(2020, 5, 17,  0,  0) # a√±o, mes, d√≠a, h, m (INCLUSIVE)
HASTA = datetime(2021, 6, 18, 23, 59) # a√±o, mes, d√≠a, h, m (INCLUSIVE)

# üëÜ

In [None]:
pdfs_d = {
    '1ESO': '1ESO/02._MATRICULA_ESO_1_LOMCE.pdf',
    '2ESO': '2ESO/02._MATRICULA_ESO_2_LOMCE.pdf',
    '3ESO': '3ESO/02._MATRICULA_ESO_3_LOMCE.pdf',
    '3PMAR': '3PMAR/02._MATRICULA_ESO_3_PMAR_LOMCE.pdf',
    '4ESO': '4ESO/02._MATRICULA_ESO_4_LOMCE.pdf',
    '1BACH': '1BACH/03. MATR√çCULA BAC_1_LOMCE.pdf',
    '2BACH': '2BACH/03. MATRICULA BAC_2_LOMCE.pdf',
    'FPB SA': 'FPB SA/02. MATR√çCULA_FPB SERVICIOS ADMINISTRATIVOS.pdf',
    'CF AD': 'CF AD/02. MATR√çCULA _CF ASISTENCIA A LA DIRECCI√ìN.pdf',
    'CF GA': 'CF GA/02. MATR√çCULA _CF GESTI√ìN ADMINISTRATIVA.pdf',
    'CF COM': 'CF COM/02. MATR√çCULA _CF ACTIVIDADES COMERCIALES.pdf',
}

csvs_d = {
    '1ESO': '1ESO/1ESO Cuestionario de matr√≠cula.csv',
    '2ESO': '2ESO/2ESO Cuestionario de matr√≠cula.csv',
    '3ESO': '3ESO/3ESO Cuestionario de matr√≠cula.csv',
    '3PMAR': '3PMAR/3PMAR Cuestionario de matr√≠cula.csv',
    '4ESO': '4ESO/4ESO Cuestionario de matr√≠cula.csv',
    '1BACH': '1BACH/1BACH Cuestionario de matr√≠cula.csv',
    '2BACH': '2BACH/2BACH Cuestionario de matr√≠cula.csv',
    'FPB SA': 'FPB SA/FPB SERVICIOS ADMINISTRATIVOS Cuestionario de matr√≠cula.csv',
    'CF AD': 'CF AD/CFGS ASISTENCIA A DIRECCI√ìN Cuestionario de matr√≠cula.csv',
    'CF GA': 'CF GA/CFGM GESTI√ìN ADMINISTRATIVA Cuestionario de matr√≠cula.csv',
    'CF COM': 'CF COM/CFGM ACTIVIDADES COMERCIALES Cuestionario de matr√≠cula.csv',
}

In [None]:
csv_file = csvs_d[CURSO]
pdf_file = pdfs_d[CURSO]
out_dir = Path(f'SALIDA_{CURSO}')

In [None]:
out_dir.mkdir(parents=True, exist_ok=True)

In [None]:
# lee CSV
mat_df = pd.read_csv(csv_file)

In [None]:
# traduce fecha moodle -> datetime
locale.setlocale(locale.LC_TIME, 'es_ES')
mat_df['Fecha'] = mat_df['Fecha'].apply(lambda x: datetime.strptime(x, '%A, %d de %B de %Y, %H:%M'))

In [None]:
# filtra fuera de fechas
mat_df = mat_df[(mat_df['Fecha'] >= DESDE) & (mat_df['Fecha'] <= HASTA)]
print(f'Hay {len(mat_df)} matr√≠culas')

In [None]:
# nulos -> '---'
mat_df = mat_df.fillna('---')

In [None]:
# multi-respuestas -> listas
if CURSO[:2] == 'CF':
    mat_df['mods'] = mat_df['M√≥dulos formativos de 1¬∫'].str.split('\n') + mat_df['M√≥dulos formativos de 2¬∫'].str.split('\n')

In [None]:
# Imprime la 1¬™ matr√≠cula
mat_df[:1].T

In [None]:
# optativas
opts = {
    'Alem√°n 2¬∫ idioma': 'ALE', # 4ESO
    'Anatom√≠a Aplicada': 'AA', # 1BAT
    'Competencia Comunicativa Oral en Ingl√©s': 'CCOI',
    'Cultura Cient√≠fica': 'CCIE', # 4ESO
    'Cultura Cl√°sica': 'CCLA',
    'Educaci√≥n Pl√°stica': 'EPV', # 4ESO
    'Educaci√≥n Pl√°stica, Visual y Audiovisual': 'EPVA',
    'Filosof√≠a': 'FIL', # 4ESO
    'F√≠sica': 'FIS',
    'Franc√©s 2¬∫ idioma': 'FRA', # 4ESO
    'Geolog√≠a': 'GEOL',
    'Inform√°tica': 'INF', # 4ESO
    'Iniciaci√≥n a la Actividad Emprendedora y Empresarial': 'IAEE',
    'M√∫sica': 'MUS', # 4ESO
    'Proyecto Interdisciplinar: Impresi√≥n 3D, programaci√≥n y rob√≥tica aplicadas': 'PI', # 4ESO
    'Psicolog√≠a': 'PSI',
    'Religi√≥n Cat√≥lica': 'REL', # 1BAT, 2BAT
    'Taller de refuerzo de Castellano': 'RCAS',
    'Taller de refuerzo de Matem√°ticas': 'RMAT',
    'Tecnolog√≠a': 'TEC', # 3ESO, 4ESO
    'Tecnolog√≠as de la Informaci√≥n y la Comunicaci√≥n I': 'TIC1', # 1BAT
    'Tecnolog√≠as de la Informaci√≥n y la Comunicaci√≥n II': 'TIC2', # 1BAT
}

In [None]:
# m√≥dulos
mods = {
    'FPB SA': {
        # 1¬∫ FPB SA
        '3001. Tratamiento Inform√°tico de Datos': 'fpb1_tid',
        '3003. T√©cnicas Administrativas B√°sicas': 'fpb1_tab',
        '3005. Atenci√≥n al Cliente': 'fpb1_ac',
        '3006. Preparaci√≥n de Pedidos y Venta de Productos': 'fpb1_ppvp',
        '3009. Ciencias Aplicadas I': 'fpb1_ccaa1',
        '3011. Comunicaci√≥n y Sociedad I': 'fpb1_cys1',
        'CV0005. Formaci√≥n y Orientaci√≥n Laboral I': 'fpb1_fol1',
        # 2¬∫ FPB SA
        '3002. Aplicaciones B√°sicas de Ofim√°tica': 'fpb2_abo',
        '3004. Archivo y Comunicaci√≥n': 'fpb2_ac',
        '3010. Ciencias Aplicadas II': 'fpb2_ccaa2',
        '3012. Comunicaci√≥n y Sociedad II': 'fpb2_cys2',
        'CV0006 Formaci√≥n y Orientaci√≥n Laboral II': 'fpb2_fol2',
        '3008. Formaci√≥n en Centros de Trabajo': 'fpb2_fct',
    },

    'CF AD': {
        # 1¬∫
        '0647. Gesti√≥n de la documentaci√≥n jur√≠dica y empresarial': '1ad_gdje',
        '0648. Recursos humanos y responsabilidad social corporativa': '1ad_rhrsc',
        '0649. Ofim√°tica y proceso de la informaci√≥n': '1ad_opi',
        '0650. Proceso integral de la actividad comercial': '1ad_piac',
        '0651. Comunicaci√≥n y atenci√≥n al cliente': '1ad_cac',
        '0179. Ingl√©s': '1ad_ing',
        '0665. Formaci√≥n y orientaci√≥n laboral': '1ad_fol',
        # 2¬∫
        '0661. Protocolo empresarial': '2ad_pe',
        '0662. Organizaci√≥n de eventos empresariales': '2ad_oee',
        '0663. Gesti√≥n avanzada de la informaci√≥n': '2ad_gai',
        '0180. Segunda lengua extranjera': '2ad_fr2',
        'CV0004. Ingl√©s t√©cnico II-S / Horario reserv. docencia en ingl√©s': '2ad_ingtec',
        '0664. Proyecto de asistencia a la direcci√≥n': '2ad_proyecto',
        '0667. Formaci√≥n en centros de trabajo': '2ad_fct',
    },
    
    'CF GA': {
        # 1¬∫
        '0437. Comunicaci√≥n empresarial y atenci√≥n al cliente': '1ga_ceac',
        '0438. Operaciones administrativas de compraventa': '1ga_oacv',
        '0439. Empresa y administraci√≥n': '1ga_ea',
        '0440. Tratamiento inform√°tico de la informaci√≥n': '1ga_tii',
        '0441. T√©cnica contable': '1ga_tc',
        '0156. Ingl√©s': '1ga_ing',
        '0449. Formaci√≥n y orientaci√≥n laboral': '1ga_fol',
        
        # 2¬∫
        '0442. Operaciones administrativas de compraventa': '2ga_oarh',
        '0443. Tratamiento de la documentaci√≥n contable': '2ga_tdc',
        '0446. Empresa en el aula': '2ga_eea',
        '0448. Operaciones auxiliares de gesti√≥n de tesorer√≠a': '2ga_oagt',
        'CV0002. Ingl√©s t√©cnico II-M / Horario reservado docencia en ingl√©s': '2ga_ingtec',
        '0451. Formaci√≥n en centros de trabajo': '2ga_fct',
    },
    
    'CF COM': {
        #1¬∫
        '1226. Marketing en la actividad comercial': '1ac_mac',
        '1229. Gesti√≥n de compras': '1ac_gc',
        '1231. Dinamizaci√≥n del punto de venta': '1ac_dpb',
        '1232. Procesos de venta': '1ac_pv',
        '1233. Aplicaciones inform√°ticas para el comercio': '1ac_aic',
        '0156. Ingl√©s': '1ac_ing',
        '1236. Formaci√≥n y Orientaci√≥n Laboral': '1ac_fol',
        # 2¬∫
        '1227. Gesti√≥n de un peque√±o comercio': '2ac_gpc',
        '1228. T√©cnicas de almac√©n': '2ac_ta',
        '1230. Venta t√©cnica': '2ac_vt',
        '1234. Servicios de atenci√≥n comercial': '2ac_sac',
        '1235. Comercio electr√≥nico': '2ac_ce',
        'CV0002. Ingl√©s t√©cnico II-M/Horario reserv. docencia Ingl√©s': '2ac_intec',
        '1237. Formaci√≥n en Centros de Trabajo': '2ac_fct',
    }
}

In [None]:
# Separa nombre de apellidos
na = mat_df['Nombre completo del usuario'].str.split(', ', expand=True)
mat_df['apellidos_alu'] = na[0]
mat_df['nombre_alu'] = na[1]

# Rellena los checkboxes
mat_df['convive_padre'] = np.where(mat_df['Convive con'] == 'Padre', 'Yes', 'Off')
mat_df['convive_madre'] = np.where(mat_df['Convive con'] == 'Madre', 'Yes', 'Off')
mat_df['convive_ambos'] = np.where(mat_df['Convive con'] == 'Ambos', 'Yes', 'Off')

# Todas las matr√≠culas v√≠a aules son de alumnos del centro
mat_df['centro_procedencia'] = 'IES N¬∫1 LIBERTAS'

# Junta apellido + nombre de padre/madre
mat_df['nombre_pad'] = mat_df['Apellidos del padre o tutor legal'] + ', ' + mat_df['Nombre del padre o tutor legal']
mat_df['nombre_mad'] = mat_df['Apellidos de la madre o tutora legal'] + ', ' + mat_df['Nombre de la madre o tutora legal']

# Renombra columnas csv -> campos pdf
mat_df = mat_df.rename(columns={
    'Con qui√©n convive el alumno': 'convive_otros', 
    'Domicilio (calle/plaza y n√∫mero) del alumno': 'domicilio_alu',
    'C√≥digo postal del alumno<span class="boundaries"></span>': 'cp_alu',
    'Localidad del alumno': 'localidad_alu',
    'Provincia del alumno': 'provincia_alu',

    'DNI/NIE del padre o tutor legal': 'dni_pad',
    'E-MAIL del padre o tutor legal': 'email_pad',
    'Tel√©fono 1 del padre o tutor legal': 'telefono1_pad',
    'Tel√©fono 2 del padre o tutor legal': 'telefono2_pad',
    'Domicilio (calle/plaza y n√∫mero) del padre o tutor legal': 'domicilio_pad',
    'C√≥digo postal del padre o tutor legal<span class="boundaries"></span>': 'cp_pad',
    'Localidad del padre o tutor legal': 'localidad_pad',
    'Provincia del padre o tutor legal': 'provincia_pad',

    'DNI/NIE de la madre o tutora legal': 'dni_mad',
    'E-MAIL de la madre o tutora legal': 'email_mad',
    'Tel√©fono 1 de la madre o tutora legal': 'telefono1_mad',
    'Tel√©fono 2 de la madre o tutora legal': 'telefono2_mad',
    'Domicilio (calle/plaza y n√∫mero) de la madre o tutora legal': 'domicilio_mad',
    'C√≥digo postal de la madre o tutora legal<span class="boundaries"></span>': 'cp_mad',
    'Localidad de la madre o tutora legal': 'localidad_mad',
    'Provincia de la madre o tutora legal': 'provincia_mad',

    'Grupo actual': 'grupo',
})

## Casillas especificas por curso (ESO)

In [None]:
if CURSO in ['1ESO', '2ESO', '3ESO', '4ESO']:
    mat_df['pluri_si'] = np.where(mat_df['Desea pertenecer al grupo pluriling√ºe'] == 'S√≠', 'Yes', 'Off')
    mat_df['pluri_no'] = np.where(mat_df['Desea pertenecer al grupo pluriling√ºe'] == 'No', 'Yes', 'Off')

if CURSO in ['3ESO']:
    mat_df['MAA'] = np.where(mat_df['Elija Matem√°ticas'] == 'Acad√©micas', 'Yes', 'Off')
    mat_df['MAP'] = np.where(mat_df['Elija Matem√°ticas'] == 'Aplicadas', 'Yes', 'Off')
    
if CURSO in ['4ESO']:
    mat_df['itinerario_ciencias'] = np.where(mat_df['Elija itinerario'] == 'Bachillerato Ciencias', 'Yes', 'Off')
    mat_df['itinerario_humanidades'] = np.where(mat_df['Elija itinerario'] == 'Bachillerato Humanidades o CCSS', 'Yes', 'Off')
    mat_df['itinerario_aplicadas'] = np.where(
        (mat_df['Elija itinerario'] == 'Ense√±anzas aplicadas con Ciencias Aplicadas a la Actividad Profesional') |
        (mat_df['Elija itinerario'] == 'Ense√±anzas aplicadas con Iniciaci√≥n a la Actividad Emprendedora y Empresarial'),
        'Yes', 'Off'
    )
    mat_df['itinerario_aplicadas_cacp'] = np.where(
        mat_df['Elija itinerario'] == 'Ense√±anzas aplicadas con Ciencias Aplicadas a la Actividad Profesional',
        'X', ''
    )
    mat_df['itinerario_aplicadas_iaee'] = np.where(
        mat_df['Elija itinerario'] == 'Ense√±anzas aplicadas con Iniciaci√≥n a la Actividad Emprendedora y Empresarial',
        'X', ''
    )

if CURSO in ['1ESO', '2ESO', '3ESO', '3PMAR', '4ESO']:
    mat_df['religion'] = np.where(mat_df['Elija Religi√≥n o Valores √âticos'] == 'Religi√≥n', 'Yes', 'Off')
    mat_df['valores']  = np.where(mat_df['Elija Religi√≥n o Valores √âticos'] == 'Valores √âticos', 'Yes', 'Off')
    mat_df['croni_si'] = np.where(mat_df['El alumno padece enfermedad cr√≥nica'] == 'S√≠', 'Yes', 'Off')
    mat_df['croni_no'] = np.where(mat_df['El alumno padece enfermedad cr√≥nica'] == 'No', 'Yes', 'Off')
    mat_df['ampa_si']  = np.where(mat_df['Pertenece a la AMPA'] == 'S√≠', 'Yes', 'Off')
    mat_df['ampa_no']  = np.where(mat_df['Pertenece a la AMPA'] == 'No', 'Yes', 'Off')

## Casillas especificas por curso (1BACH)

In [None]:
if CURSO in ['1BACH']:
    # Itinerarios
    mat_df['itinerario_ciencias'] = np.where(
        (mat_df['Elija itinerario'] == 'Ciencias con Dibujo T√©cnico I') |
        (mat_df['Elija itinerario'] == 'Ciencias con Biolog√≠a y Geolog√≠a'),
        'Yes', 'Off'
    )
    mat_df['itinerario_humanidades'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades con H¬™ Mundo Contempor√°neo') |
        (mat_df['Elija itinerario'] == 'Humanidades con Literatura Universal'),
        'Yes', 'Off'
    )
    mat_df['itinerario_ccss'] = np.where(
        (mat_df['Elija itinerario'] == 'CCSS con H¬™ Mundo Contempor√°neo') |
        (mat_df['Elija itinerario'] == 'CCSS con Literatura Universal'),
        'Yes', 'Off'
    )
    # Troncales
    mat_df['troncal_DT1'] = np.where(
        mat_df['Elija itinerario'] == 'Ciencias con Dibujo T√©cnico I',
        'X', ''
    )
    mat_df['troncal_BG'] = np.where(
        mat_df['Elija itinerario'] == 'Ciencias con Biolog√≠a y Geolog√≠a',
        'X', ''
    )
    mat_df['troncal_HMC'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades con H¬™ Mundo Contempor√°neo') |
        (mat_df['Elija itinerario'] == 'CCSS con H¬™ Mundo Contempor√°neo'),
        'X', ''
    )
    mat_df['troncal_LU'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades con Literatura Universal') |
        (mat_df['Elija itinerario'] == 'CCSS con Literatura Universal'),
        'X', ''
    )

## Casillas especificas por curso (2BACH)

In [None]:
if CURSO in ['2BACH']:
    # Itinerarios
    mat_df['itinerario_ciencias'] = np.where(
        (mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + Biolog√≠a + Qu√≠mica') |
        (mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + F√≠sica + Dibujo T√©cnico II') |
        (mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + F√≠sica + Qu√≠mica'),
        'Yes', 'Off'
    )
    mat_df['itinerario_humanidades'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades + Geograf√≠a') |
        (mat_df['Elija itinerario'] == 'Humanidades + H¬™ del Arte'),
        'Yes', 'Off'
    )
    mat_df['itinerario_ccss'] = np.where(
        (mat_df['Elija itinerario'] == 'CCSS + Geograf√≠a') |
        (mat_df['Elija itinerario'] == 'CCSS + H¬™ del Arte'),
        'Yes', 'Off'
    )
    # Troncales
    mat_df['troncal_mat2_bio_qui'] = np.where(
        mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + Biolog√≠a + Qu√≠mica',
        'X', ''
    )
    mat_df['troncal_mat2_fis_dt2'] = np.where(
        mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + F√≠sica + Dibujo T√©cnico II',
        'X', ''
    )
    mat_df['troncal_mat2_fis_qui'] = np.where(
        mat_df['Elija itinerario'] == 'Ciencias + Matem√°ticas II + F√≠sica + Qu√≠mica',
        'X', ''
    )
    mat_df['troncal_GEO'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades + Geograf√≠a') |
        (mat_df['Elija itinerario'] == 'CCSS + Geograf√≠a'),
        'X', ''
    )
    mat_df['troncal_HA'] = np.where(
        (mat_df['Elija itinerario'] == 'Humanidades + H¬™ del Arte') |
        (mat_df['Elija itinerario'] == 'CCSS + H¬™ del Arte'),
        'X', ''
    )

    # EF voluntaria
    mat_df['vol_ef'] = np.where(mat_df['Cursar Educaci√≥n Fisicodeportiva y Salud'] == 'S√≠', 'X', '')

## Casillas espec√≠ficas ciclos

In [None]:
def cumplimenta_checkboxes(mat_df, pregunta, respuestas_y_campos):
    for respuesta, campo in respuestas_y_campos.items():
        mat_df[campo] = np.where(mat_df[pregunta] == respuesta, 'Yes', 'Off')

In [None]:
if CURSO == 'CF AD':
    cumplimenta_checkboxes(
        mat_df,
        'Accede al ciclo por cumplir el siguiente requisito',
        {
            'Superar prueba de acceso a un ciclo formativo de grado superior' : 'acceso_pac',
            'Superar prueba de acceso a la universidad para mayores de 25 a√±os' : 'acceso_25',
            'T√≠tulo de Bachiller LOGSE/LOCE/LOE/COU/BUP' : 'acceso_batx',
            'Acceso desde un grado medio' : 'acceso_gm',
        }
    )

In [None]:
if CURSO in ['CF GA', 'CF COM']:
    cumplimenta_checkboxes(
        mat_df,
        'Accede al ciclo por cumplir el siguiente requisito',
        {
            'Superar prueba de acceso a un ciclo formativo de grado medio' : 'acceso_pac',
            'Superar prueba de acceso a la universidad para mayores de 25 a√±os' : 'acceso_25',
            'Haber superado 2¬∫ BUP' : 'acceso_2bup',
            'T√≠tulo Profesional B√°sico' : 'acceso_tpb',
            'T√≠tulo de Bachiller LOGSE/LOCE/LOE/LOMCE' : 'acceso_batx',
            'Graduado en E.S.O.' : 'acceso_ges',
        }
    )

## Numera optativas por preferencia

In [None]:
for nbloque, enunciado in enumerate(['Optativa', 'Primera optativa', 'Segunda optativa']):
    for k, v in opts.items():
        conds = [ mat_df[f'{enunciado} ({x}¬™ preferencia)'] == k for x in range(1, 10) if f'{enunciado} ({x}¬™ preferencia)' in mat_df.columns ]
        choices = list(range(1, len(conds) + 1))
        if choices:
            mat_df[f'O{nbloque}_{v}'] = np.select(conds, choices, default='')

## M√≥dulos FP

In [None]:
if CURSO in ['CF AD', 'CF GA', 'CF COM']:
    for nombre_modulo, campo_pdf in mods[CURSO].items():
        seleccion = mat_df['mods'].apply(lambda respuesta: nombre_modulo in respuesta)
        mat_df[campo_pdf] = np.where(seleccion, 'Yes', 'Off')

## Genera PDFs

In [None]:
for _, row in tqdm(mat_df.iterrows(), total=len(mat_df)):
    nombre = row['Nombre completo del usuario']
    fields = [ (k, v) for k, v in row.to_dict().items() ]
    #print(fields)
    fdf = forge_fdf("", fields, [], [], [])
    tmp_file = 'tmp.fdf'
    with open(tmp_file, 'wb') as fdf_file:
        fdf_file.write(fdf)

    if CURSO in ['1ESO', '2ESO', '3ESO', '3PMAR', '4ESO', '1BACH', '2BACH']:
        grupo  = row['grupo']
        output_file = out_dir / f'{grupo} {nombre}.pdf'
    else:
        output_file = out_dir / f'{nombre}.pdf'
        
    cmd = f'pdftk "{pdf_file}" fill_form "{tmp_file}" output "{output_file}" dont_ask'
    
    assert os.system(cmd) == 0, f'Petada en la generaci√≥n del PDF, mira el log de jupyter:\n{cmd}'
    os.remove(tmp_file)