##**Costeo 2025: Fortalecimiento de los servicios educativos en los centros de educación básica alternativa para la atención de estudiantes con discapacidad - DEBA**



*   Autor: Manuel Reyes Quispe
*   Equipo: Analítica de Datos y Programación de Presupuesto Territorial



In [29]:
# pip install dbfread
# pip install openpyxl

In [30]:
import pandas as pd
import numpy as np
from dbfread import DBF
from os import write

In [31]:
# importamos la base de metas peas CAS
peas = pd.read_excel('D:/2025/IAP/Interpretes DEBA/input/Metas_contratacion_InterpretesEBA.xlsx', skiprows=2, dtype={'Código Local': str, 'Código Modular': str,'Anexo':str})

peas = peas.iloc[:-1] # eliminamos la última fila que registra el total

peas.head(5)

Unnamed: 0,Pliego,Unidad Ejecutora,DRE/UGEL,Código Modular,Anexo,Código Local,NOMBRE DE CEBA,Modelo Lingüístico de lengua de señas peruana para EBA,Intérprete de lengua de señas peruana para EBA
0,10. LIMA METROPOLITANA,001. USE 01 SAN JUAN DE MIRAFLORES,Ugel 01 San Juan De Miraflores,1724715,0,343852,PAEBA VILLA EL SALVADOR,0,1
1,10. LIMA METROPOLITANA,001. USE 01 SAN JUAN DE MIRAFLORES,Ugel 01 San Juan De Miraflores,1315316,0,343852,PAEBA VILLA EL SALVADOR,2,5
2,10. LIMA METROPOLITANA,003. USE 03 CERCADO,Ugel 03 Breña,605618,0,288092,0040 HIPOLITO UNANUE,0,1
3,10. LIMA METROPOLITANA,003. USE 03 CERCADO,Ugel 03 Breña,337345,0,288092,0040 HIPOLITO UNANUE,2,6
4,10. LIMA METROPOLITANA,004. USE 04 COMAS,Ugel 04 Comas,830968,0,301625,2048 JOSE CARLOS MARIATEGUI,2,2


In [32]:
# llevamos la base de metas CAS a un formato long
peas_long = pd.melt(peas, id_vars=['Pliego', 'Unidad Ejecutora', 'DRE/UGEL', 'Código Modular', 'Anexo', 'Código Local', 'NOMBRE DE CEBA'],
                    value_vars=['Intérprete de lengua de señas peruana para EBA','Modelo Lingüístico de lengua de señas peruana para EBA'],
                    var_name='Perfil', value_name='PEAS')

peas_long = peas_long[peas_long['PEAS'] > 0]

peas_long.head(5)

Unnamed: 0,Pliego,Unidad Ejecutora,DRE/UGEL,Código Modular,Anexo,Código Local,NOMBRE DE CEBA,Perfil,PEAS
0,10. LIMA METROPOLITANA,001. USE 01 SAN JUAN DE MIRAFLORES,Ugel 01 San Juan De Miraflores,1724715,0,343852,PAEBA VILLA EL SALVADOR,Intérprete de lengua de señas peruana para EBA,1
1,10. LIMA METROPOLITANA,001. USE 01 SAN JUAN DE MIRAFLORES,Ugel 01 San Juan De Miraflores,1315316,0,343852,PAEBA VILLA EL SALVADOR,Intérprete de lengua de señas peruana para EBA,5
2,10. LIMA METROPOLITANA,003. USE 03 CERCADO,Ugel 03 Breña,605618,0,288092,0040 HIPOLITO UNANUE,Intérprete de lengua de señas peruana para EBA,1
3,10. LIMA METROPOLITANA,003. USE 03 CERCADO,Ugel 03 Breña,337345,0,288092,0040 HIPOLITO UNANUE,Intérprete de lengua de señas peruana para EBA,6
4,10. LIMA METROPOLITANA,004. USE 04 COMAS,Ugel 04 Comas,830968,0,301625,2048 JOSE CARLOS MARIATEGUI,Intérprete de lengua de señas peruana para EBA,2


In [33]:
# Leer el archivo DBF como una lista de diccionarios - importamos el padron web del escale al corte del 20.12.2024
records = DBF('D:/2025/IAP/Interpretes DEBA/input/Padron_web_20241220.dbf', load=True)

# Convertir a un DataFrame de pandas
padron = pd.DataFrame(iter(records))

In [34]:
# validacion de metas peas
peas_long_2 = peas_long.iloc[:,2:]
peas_long_2['id'] = pd.to_numeric(peas_long_2['Código Modular'] + peas_long_2['Anexo'], errors='coerce')

peas_long_2

Unnamed: 0,DRE/UGEL,Código Modular,Anexo,Código Local,NOMBRE DE CEBA,Perfil,PEAS,id
0,Ugel 01 San Juan De Miraflores,1724715,0,343852,PAEBA VILLA EL SALVADOR,Intérprete de lengua de señas peruana para EBA,1,17247150
1,Ugel 01 San Juan De Miraflores,1315316,0,343852,PAEBA VILLA EL SALVADOR,Intérprete de lengua de señas peruana para EBA,5,13153160
2,Ugel 03 Breña,605618,0,288092,0040 HIPOLITO UNANUE,Intérprete de lengua de señas peruana para EBA,1,6056180
3,Ugel 03 Breña,337345,0,288092,0040 HIPOLITO UNANUE,Intérprete de lengua de señas peruana para EBA,6,3373450
4,Ugel 04 Comas,830968,0,301625,2048 JOSE CARLOS MARIATEGUI,Intérprete de lengua de señas peruana para EBA,2,8309680
5,Ugel 06 Ate,315259,0,338817,1137 JOSE ANTONIO ENCINAS,Intérprete de lengua de señas peruana para EBA,1,3152590
6,Ugel 06 Ate,601740,0,338817,1137 JOSE ANTONIO ENCINAS,Intérprete de lengua de señas peruana para EBA,1,6017400
7,Ugel Arequipa Norte,1666254,0,55417,POLIVALENTE,Intérprete de lengua de señas peruana para EBA,4,16662540
8,Ugel Cusco,497628,0,146154,HUMBERTO LUNA,Intérprete de lengua de señas peruana para EBA,4,4976280
9,Ugel Quispicanchi,1724244,0,168117,51030 LUIS NAVARRETE,Intérprete de lengua de señas peruana para EBA,1,17242440


In [35]:
# nos quedamos con campos relevantes del padron web importado
padron_2 = padron[['COD_MOD', 'ANEXO', 'CODLOCAL', 'CEN_EDU', 'CODOOII','D_DREUGEL']]

padron_2['id'] = pd.to_numeric(padron_2['COD_MOD'] + padron_2['ANEXO'], errors='coerce')

padron_2.head(5)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  padron_2['id'] = pd.to_numeric(padron_2['COD_MOD'] + padron_2['ANEXO'], errors='coerce')


Unnamed: 0,COD_MOD,ANEXO,CODLOCAL,CEN_EDU,CODOOII,D_DREUGEL,id
0,415547,0,16100,123,20001,UGEL HUARAZ,4155470
1,415638,0,15172,122,20001,UGEL HUARAZ,4156380
2,415646,0,15186,233,20001,UGEL HUARAZ,4156460
3,415877,0,16751,COLEGIO PARROQUIAL NUESTRA SEÑORA DEL SAGRADO ...,20001,UGEL HUARAZ,4158770
4,567206,0,16119,268,20001,UGEL HUARAZ,5672060


In [36]:
# realizamos el join entre la la base de metas cas y el padron web
peas_long_3 = pd.merge(peas_long_2, padron_2, on='id', how='left')

peas_long_4 = peas_long_3[['Perfil','PEAS','COD_MOD','ANEXO','CODLOCAL','CEN_EDU','CODOOII']]

peas_long_4.head(5)

Unnamed: 0,Perfil,PEAS,COD_MOD,ANEXO,CODLOCAL,CEN_EDU,CODOOII
0,Intérprete de lengua de señas peruana para EBA,1,1724715,0,343852,PAEBA VILLA EL SALVADOR,150102
1,Intérprete de lengua de señas peruana para EBA,5,1315316,0,343852,PAEBA VILLA EL SALVADOR,150102
2,Intérprete de lengua de señas peruana para EBA,1,605618,0,288092,0040 HIPOLITO UNANUE,150104
3,Intérprete de lengua de señas peruana para EBA,6,337345,0,288092,0040 HIPOLITO UNANUE,150104
4,Intérprete de lengua de señas peruana para EBA,2,830968,0,301625,2048 JOSE CARLOS MARIATEGUI,150105


In [37]:
# importamos la base de ugel-ubigeo que nos permitirá incorporar el Pliego, UE, Ugel con el nombre correcto y homogéneo
ugel = pd.read_excel('D:/2025/IAP/Interpretes DEBA/input/base_ue_ugel_ubigeo_2024.xlsx', sheet_name='base' ,dtype={'CODOOII': str})

ugel['CODOOII'] = ugel['CODOOII'].astype(str).str.zfill(6)

ugel = ugel[~ugel['UGEL'].str.contains('COLEGIO MILITAR', na=False)]
ugel = ugel[~ugel['NOM_UE'].str.contains('COLEGIO MILITAR', na=False)]

In [38]:
# realizamos el join para incorporar los campos con nombres correctos
peas_long_5 = pd.merge(peas_long_4, ugel, on = 'CODOOII', how='left')

# Definir el orden de las columnas
column_order = ['PLIEGO','NOM_PLIEGO','EJECUTORA','NOM_UE','CODOOII','UGEL','COD_MOD','ANEXO','CODLOCAL','CEN_EDU','Perfil', 'PEAS']

# Reordenar las columnas del DataFrame
peas_long_5 = peas_long_5[column_order]

peas_long_5.to_excel('D:/2025/IAP/Interpretes DEBA/output/MEF/METAS_PEAS_VAL_2025.xlsx', index=False) # este insumo sería la base de metas cas validado