# Benchmarking
### *Comisarías de la PNP en Lima Metropolitana y Callao (2017)*

In [1]:
import pandas as pd

pnp=pd.read_csv("https://raw.githubusercontent.com/romloayza/benchmarking_optimization/refs/heads/main/pnp.csv")
pnp

Unnamed: 0,DISTRITO,EFECTIVOS,PATRULLAJE,PROGRAMAS,OPERATIVOS,DENUNCIAS
0,ANCON,160,74,53,576,303
1,ATE,736,246,11959,3779,5210
2,BARRANCO,264,62,93,1122,1754
3,BELLAVISTA,315,125,216,1399,330
4,BREÑA,432,231,32,2099,2159
5,CALLAO,1892,884,282,10735,6962
6,CARABAYLLO,538,221,819,2686,2525
7,CARMEN DE LA LEGUA REYNOSO,151,82,3,159,591
8,CHACLACAYO,136,34,50,931,840
9,CHORRILLOS,794,291,211,3893,1548


#### Descripción de las variables:
**Inputs**
- Efectivos: Total de efectivos asignados en la comisaría - Patrullaje: Número total de efectivos policiales que realizan patrullaje motorizado (auto, camioneta o moto)
- Programas: Cantidad de programas de prevención fueron atendidos (Juntas Vecinales, Clubes de menores, Policía escolar, Brigada de autoprotección escolar, Red de cooperantes para la seguridad ciudadana, Patrulla juvenil, Otros)

**Outputs**
- Operativos: Cantidad total por tipo de operativos realizados en el año por la comisaría- Denuncias: Cantidad total de denuncias 




In [3]:
# ratio operativos - patrullaje:
pnp['rate_OperativosByPatrullaje']=(pnp.OPERATIVOS/pnp.PATRULLAJE)
#ratio denuncias - efectivos
pnp['rate_DenunciasByEfectivos']=(pnp.DENUNCIAS/pnp.EFECTIVOS)

In [7]:
import warnings
warnings.filterwarnings("ignore")

import altair as alt

# Creación del gráfico de puntos con tamaño reducido y transparencia
points = alt.Chart(pnp).mark_point(size=50, opacity=0.5).encode(
    x='rate_OperativosByPatrullaje:Q',
    y='rate_DenunciasByEfectivos:Q'
).interactive()  # Habilitar interactividad para el gráfico

# Ajuste del texto para mejor visualización
text = points.mark_text(
    align='left',    # Alineación del texto a la izquierda
    baseline='middle',
    dx=7,            # Distancia horizontal para evitar traslapes con el punto
    fontSize=10,     # Ajuste del tamaño de fuente
).encode(
    text='DISTRITO'
)

points + text

In [9]:
warnings.filterwarnings("ignore")

# Creación del gráfico de puntos con tamaño y transparencia ajustados
points = alt.Chart(pnp).mark_point(size=50, opacity=0.5).encode(
    x='rate_OperativosByPatrullaje:Q',
    y='rate_DenunciasByEfectivos:Q'
).properties(
    width=800,    # Ajusta el ancho del gráfico
    height=600    # Ajusta la altura del gráfico
).interactive()  # Habilitar interactividad para el gráfico

# Ajuste del texto para mejor visualización
text = points.mark_text(
    align='left',    # Alineación del texto a la izquierda
    baseline='middle',
    dx=7,            # Distancia horizontal para evitar traslapes con el punto
    fontSize=10,     # Ajuste del tamaño de fuente
).encode(
    text='DISTRITO'
)

points + text

In [12]:
pnp[['DISTRITO','rate_OperativosByPatrullaje','rate_DenunciasByEfectivos']].sort_values(by='rate_OperativosByPatrullaje',ascending=False).head()

Unnamed: 0,DISTRITO,rate_OperativosByPatrullaje,rate_DenunciasByEfectivos
25,MI PERU,317.05,1.807692
31,PUNTA HERMOSA,163.3,1.267857
10,CIENEGUILLA,62.37037,1.298507
32,PUNTA NEGRA,59.65625,0.388235
44,SANTA ROSA,59.619048,0.475


In [14]:
pnp[['DISTRITO','rate_OperativosByPatrullaje','rate_DenunciasByEfectivos']].sort_values(by='rate_DenunciasByEfectivos',ascending=True).head()

Unnamed: 0,DISTRITO,rate_OperativosByPatrullaje,rate_DenunciasByEfectivos
43,SANTA MARIA DEL MAR,10.090909,0.05
32,PUNTA NEGRA,59.65625,0.388235
44,SANTA ROSA,59.619048,0.475
17,LA PUNTA,0.711538,0.574468
34,SAN BARTOLO,46.697674,0.6


In [15]:
# Identificar las comisarías más eficientes en cada ratio
Best_OperativosByPatrullaje = pnp.rate_OperativosByPatrullaje.idxmax()
Best_DenunciasByEfectivos = pnp.rate_DenunciasByEfectivos.idxmin()

# Obtener los puntos frontera para los ratios
frontier1 = pnp.loc[Best_OperativosByPatrullaje, ['rate_OperativosByPatrullaje', 'rate_DenunciasByEfectivos']].to_list()
frontier2 = pnp.loc[Best_DenunciasByEfectivos, ['rate_OperativosByPatrullaje', 'rate_DenunciasByEfectivos']].to_list()

# Puntos auxiliares para definir la frontera
frontier1v = [frontier1[0], 0]           # Máximo operativos por patrullaje, mínimo denuncias
frontier2h = [0, frontier2[1]]           # Mínimo operativos, mínimo denuncias por efectivos

# Construir el DataFrame de la frontera de eficiencia
envelope = pd.DataFrame([frontier2h, frontier2, frontier1, frontier1v], columns=['x', 'y'])
envelope


Unnamed: 0,x,y
0,0.0,0.05
1,10.090909,0.05
2,317.05,1.807692
3,317.05,0.0


In [16]:
points + text + alt.Chart(envelope).mark_line(color='red').encode(
    x='x',
    y='y',
)

In [18]:
## installation
!pip install -q Pyfrontier

In [19]:
pnpInput=pnp.columns[1:4].to_list()
pnpOutput=pnp.columns[4:6].to_list()

In [20]:
from Pyfrontier.frontier_model import EnvelopDEA

dea_pnp_vrs_in = EnvelopDEA("VRS", "in")
dea_pnp_vrs_in.fit(
    inputs=pnp[pnpInput].to_numpy(),
    outputs=pnp[pnpOutput].to_numpy()
)

In [22]:
pnp['vrs_in']=[r.score for r in dea_pnp_vrs_in.result]
pnp.set_index(pnp.DISTRITO,inplace=True)
pnp['vrs_in']

DISTRITO
ANCON                         0.488322
ATE                           0.486174
BARRANCO                      0.713555
BELLAVISTA                    0.269602
BREÑA                         0.533058
CALLAO                        0.842388
CARABAYLLO                    0.388635
CARMEN DE LA LEGUA REYNOSO    1.000000
CHACLACAYO                    0.941906
CHORRILLOS                    0.208353
CIENEGUILLA                   0.668225
COMAS                         0.360956
EL AGUSTINO                   0.321050
INDEPENDENCIA                 0.515602
JESUS MARIA                   0.641152
LA MOLINA                     0.307491
LA PERLA                      0.592526
LA PUNTA                      0.975369
LA VICTORIA                   0.689029
LIMA                          0.767111
LINCE                         0.617333
LOS OLIVOS                    1.000000
LURIGANCHO                    0.337523
LURIN                         0.566922
MAGDALENA DEL MAR             0.852502
MI PERU         

In [24]:
!pip install -q py4etrics

In [25]:
warnings.filterwarnings("ignore")

import numpy as np # linear algebra
from py4etrics import tobit
# import statsmodels.api as sm

pnp['censored'] =np.where(pnp['vrs_in']==1, 1, 0)
cens = pnp['censored']
endog = pnp.loc[:,'vrs_in']
exog = pnp.loc[:,'EFECTIVOS':'DENUNCIAS']

tobit_res = tobit.Tobit(endog, exog, cens,right=1).fit()
tobit_res.summary()

Optimization terminated successfully.
         Current function value: 0.782449
         Iterations: 239
         Function evaluations: 376


0,1,2,3
Dep. Variable:,vrs_in,Pseudo R-squ:,-0.997
Method:,Maximum Likelihood,Log-Likelihood:,-39.1
No. Observations:,50,LL-Null:,-19.6
No. Uncensored Obs:,41,LL-Ratio:,-39.1
No. Left-censored Obs:,0,LLR p-value:,1.000
No. Right-censored Obs:,9,AIC:,86.2
Df Residuals:,45,BIC:,93.9
Df Model:,4,Covariance Type:,nonrobust

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
EFECTIVOS,-6.38e-05,0.001,-0.083,0.934,-0.002,0.001
PATRULLAJE,-0.0006,0.002,-0.377,0.706,-0.004,0.003
PROGRAMAS,-1.963e-07,4.63e-05,-0.004,0.997,-9.09e-05,9.05e-05
OPERATIVOS,0.0001,4e-05,2.820,0.005,3.44e-05,0.000
DENUNCIAS,8.696e-05,4.99e-05,1.744,0.081,-1.08e-05,0.000
Log(Sigma),-0.6450,0.114,-5.670,0.000,-0.868,-0.422
