# Importaciones

In [18]:
import numpy as np
import pandas as pd

# Data

In [19]:
dd = pd.read_csv("delitos_limpio.csv")
dd

Unnamed: 0,anio_denuncia,generico,subgenerico,cantidad,ubigeo_pjfs,dpto_pjfs
0,2019,contra el honor,contra el honor (sin especificar delito subgen...,4,10101,amazonas
1,2019,contra el honor,"injuria,calumnia y difamacion",1,10101,amazonas
2,2019,contra el honor,"injuria,calumnia y difamacion",2,10101,amazonas
3,2019,contra el honor,"injuria,calumnia y difamacion",14,10101,amazonas
4,2019,contra el honor,"injuria,calumnia y difamacion",1,10101,amazonas
...,...,...,...,...,...,...
47890,2023,delitos ambientales,responsabilidad funcional e información falsa,6,250101,ucayali
47891,2023,delitos tributarios,contrabando,1,250101,ucayali
47892,2023,contra la voluntad popular,delitos contra el derecho al sufragio,1,250101,ucayali
47893,2023,contra el patrimonio,delitos informaticos contra el patrimonio,223,250101,ucayali


In [20]:
poblacion = pd.read_excel("..\INEI_2019-2023\INEI_poblacion_estimada_2019-2023.xlsx")

In [21]:
# elimina la fila con "peru" en departamento
poblacion = poblacion[poblacion["departamento"] != "peru"]

#haz que el index inicie de 0 
poblacion = poblacion.reset_index(drop=True)
poblacion

Unnamed: 0,ubigeo,departamento,total_2019,total_2020,total_2021,total_2022,total_2023
0,10000,amazonas,423863,426806,428512,429483,429943
1,20000,ancash,1169522,1180638,1188391,1194156,1198547
2,30000,apurimac,429587,430736,430609,429720,428311
3,40000,arequipa,1464638,1497438,1526669,1553994,1580075
4,50000,ayacucho,664494,668213,669979,670579,670377
5,60000,cajamarca,1447891,1453711,1455245,1454217,1451436
6,70000,callao,1105512,1129854,1151480,1171648,1190860
7,80000,cusco,1340457,1357075,1369932,1380594,1389737
8,90000,huancavelica,371260,365317,358356,350845,343026
9,100000,huanuco,759851,760267,758416,755213,751097


In [22]:
#actualiza los departamentos huanuco, piura y cajamarca
poblacion.loc[poblacion["departamento"] == "huanuco ", "departamento"] = "huanuco"
poblacion.loc[poblacion["departamento"] == "piura ", "departamento"] = "piura"
poblacion.loc[poblacion["departamento"] == "cajamarca ", "departamento"] = "cajamarca"

# cod_inseguridad * anio_denuncia * dpto_pjfs

In [23]:
# genéricos establecidos para delitos violentos
cod_inseguridad = [
    "contra la vida/el cuerpo y la salud",
    "contra la libertad",
    "contra el patrimonio",
    "contra la tranquilidad publica",
    "contra la seguridad publica"
]

In [24]:
# copia dd en dd_inseguridad
dd_inseguridad = dd.copy()

## Otros: generico y subgenerico

In [25]:
# convertir los generico a "otros" si el generico no está en la lista cod_inseguridad
dd_inseguridad.loc[~dd_inseguridad["generico"].isin(cod_inseguridad), "generico"] = "otros"

# convertir los subgenericos a "otros" si el generico es "otros"
dd_inseguridad.loc[dd_inseguridad["generico"] == "otros", "subgenerico"] = "otros"
dd_inseguridad

Unnamed: 0,anio_denuncia,generico,subgenerico,cantidad,ubigeo_pjfs,dpto_pjfs
0,2019,otros,otros,4,10101,amazonas
1,2019,otros,otros,1,10101,amazonas
2,2019,otros,otros,2,10101,amazonas
3,2019,otros,otros,14,10101,amazonas
4,2019,otros,otros,1,10101,amazonas
...,...,...,...,...,...,...
47890,2023,otros,otros,6,250101,ucayali
47891,2023,otros,otros,1,250101,ucayali
47892,2023,otros,otros,1,250101,ucayali
47893,2023,contra el patrimonio,delitos informaticos contra el patrimonio,223,250101,ucayali


## tabla cruzada

In [26]:
dd_inseguridad = dd_inseguridad.groupby(["anio_denuncia", "generico", "dpto_pjfs"]).agg({"cantidad": "sum"}).reset_index()
dd_inseguridad

Unnamed: 0,anio_denuncia,generico,dpto_pjfs,cantidad
0,2019,contra el patrimonio,amazonas,2678
1,2019,contra el patrimonio,ancash,12147
2,2019,contra el patrimonio,apurimac,3485
3,2019,contra el patrimonio,arequipa,15706
4,2019,contra el patrimonio,ayacucho,5858
...,...,...,...,...
745,2023,otros,puno,5610
746,2023,otros,san martin,6253
747,2023,otros,tacna,4002
748,2023,otros,tumbes,2788


# incidencia: tabla cruzada con poblacion

In [11]:
dd_inseguridad

Unnamed: 0,anio_denuncia,generico,dpto_pjfs,cantidad
0,2019,contra el patrimonio,amazonas,2678
1,2019,contra el patrimonio,ancash,12147
2,2019,contra el patrimonio,apurimac,3485
3,2019,contra el patrimonio,arequipa,15706
4,2019,contra el patrimonio,ayacucho,5858
...,...,...,...,...
745,2023,otros,puno,5610
746,2023,otros,san martin,6253
747,2023,otros,tacna,4002
748,2023,otros,tumbes,2788


In [12]:
# valores únicos de departamento
dd_inseguridad["dpto_pjfs"].unique()

array(['amazonas', 'ancash', 'apurimac', 'arequipa', 'ayacucho',
       'cajamarca', 'callao', 'cusco', 'huancavelica', 'huanuco', 'ica',
       'junin', 'la libertad', 'lambayeque', 'lima', 'loreto',
       'madre de dios', 'moquegua', 'pasco', 'piura', 'puno',
       'san martin', 'tacna', 'tumbes', 'ucayali'], dtype=object)

In [13]:
poblacion["departamento"].unique()

array(['amazonas', 'ancash', 'apurimac', 'arequipa', 'ayacucho',
       'cajamarca', 'callao', 'cusco', 'huancavelica', 'huanuco', 'ica',
       'junin', 'la libertad', 'lambayeque', 'lima', 'loreto',
       'madre de dios', 'moquegua', 'pasco', 'piura', 'puno',
       'san martin', 'tacna', 'tumbes', 'ucayali'], dtype=object)

In [27]:
#separar por anio df_inseguridad
dd_inseguridad_2019 = dd_inseguridad[dd_inseguridad["anio_denuncia"] == 2019]
dd_inseguridad_2020 = dd_inseguridad[dd_inseguridad["anio_denuncia"] == 2020]
dd_inseguridad_2021 = dd_inseguridad[dd_inseguridad["anio_denuncia"] == 2021]
dd_inseguridad_2022 = dd_inseguridad[dd_inseguridad["anio_denuncia"] == 2022]
dd_inseguridad_2023 = dd_inseguridad[dd_inseguridad["anio_denuncia"] == 2023]

In [28]:
#agrupa por departamento la poblacion total del 2019 en dd_inseguridad_2019
dd_inseguridad_2019 = dd_inseguridad_2019.merge(poblacion[["departamento", "total_2019"]], left_on="dpto_pjfs", right_on="departamento", how="left")

dd_inseguridad_2020 = dd_inseguridad_2020.merge(poblacion[["departamento", "total_2020"]], left_on="dpto_pjfs", right_on="departamento", how="left")
dd_inseguridad_2021 = dd_inseguridad_2021.merge(poblacion[["departamento", "total_2021"]], left_on="dpto_pjfs", right_on="departamento", how="left")
dd_inseguridad_2022 = dd_inseguridad_2022.merge(poblacion[["departamento", "total_2022"]], left_on="dpto_pjfs", right_on="departamento", how="left")
dd_inseguridad_2023 = dd_inseguridad_2023.merge(poblacion[["departamento", "total_2023"]], left_on="dpto_pjfs", right_on="departamento", how="left")

dd_inseguridad_2019
dd_inseguridad_2020
dd_inseguridad_2021
dd_inseguridad_2022
dd_inseguridad_2023

Unnamed: 0,anio_denuncia,generico,dpto_pjfs,cantidad,departamento,total_2023
0,2023,contra el patrimonio,amazonas,4249,amazonas,429943
1,2023,contra el patrimonio,ancash,14501,ancash,1198547
2,2023,contra el patrimonio,apurimac,3902,apurimac,428311
3,2023,contra el patrimonio,arequipa,27241,arequipa,1580075
4,2023,contra el patrimonio,ayacucho,9257,ayacucho,670377
...,...,...,...,...,...,...
145,2023,otros,puno,5610,puno,1217951
146,2023,otros,san martin,6253,san martin,935194
147,2023,otros,tacna,4002,tacna,390279
148,2023,otros,tumbes,2788,tumbes,263164


In [None]:
# #guarga los dataframes en csv
# dd_inseguridad_2019.to_csv("dd_inseguridad_2019.csv", index=False)
# dd_inseguridad_2020.to_csv("dd_inseguridad_2020.csv", index=False)
# dd_inseguridad_2021.to_csv("dd_inseguridad_2021.csv", index=False)
# dd_inseguridad_2022.to_csv("dd_inseguridad_2022.csv", index=False)
# dd_inseguridad_2023.to_csv("dd_inseguridad_2023.csv", index=False)

In [29]:
# calcular la incidencia de delitos por cada 100,000 habitantes
dd_inseguridad_2019["incidencia"] = (dd_inseguridad_2019["cantidad"] / dd_inseguridad_2019["total_2019"]) * 100000
dd_inseguridad_2020["incidencia"] = (dd_inseguridad_2020["cantidad"] / dd_inseguridad_2020["total_2020"]) * 100000
dd_inseguridad_2021["incidencia"] = (dd_inseguridad_2021["cantidad"] / dd_inseguridad_2021["total_2021"]) * 100000
dd_inseguridad_2022["incidencia"] = (dd_inseguridad_2022["cantidad"] / dd_inseguridad_2022["total_2022"]) * 100000
dd_inseguridad_2023["incidencia"] = (dd_inseguridad_2023["cantidad"] / dd_inseguridad_2023["total_2023"]) * 100000

dd_inseguridad_2019

Unnamed: 0,anio_denuncia,generico,dpto_pjfs,cantidad,departamento,total_2019,incidencia
0,2019,contra el patrimonio,amazonas,2678,amazonas,423863,631.807919
1,2019,contra el patrimonio,ancash,12147,ancash,1169522,1038.629457
2,2019,contra el patrimonio,apurimac,3485,apurimac,429587,811.244288
3,2019,contra el patrimonio,arequipa,15706,arequipa,1464638,1072.346887
4,2019,contra el patrimonio,ayacucho,5858,ayacucho,664494,881.573047
...,...,...,...,...,...,...,...
145,2019,otros,puno,5630,puno,1239022,454.390640
146,2019,otros,san martin,2481,san martin,884283,280.566289
147,2019,otros,tacna,3744,tacna,363205,1030.822814
148,2019,otros,tumbes,2907,tumbes,246699,1178.359053


In [30]:
dd_inseguridad_2023

Unnamed: 0,anio_denuncia,generico,dpto_pjfs,cantidad,departamento,total_2023,incidencia
0,2023,contra el patrimonio,amazonas,4249,amazonas,429943,988.270538
1,2023,contra el patrimonio,ancash,14501,ancash,1198547,1209.881632
2,2023,contra el patrimonio,apurimac,3902,apurimac,428311,911.020263
3,2023,contra el patrimonio,arequipa,27241,arequipa,1580075,1724.032087
4,2023,contra el patrimonio,ayacucho,9257,ayacucho,670377,1380.864797
...,...,...,...,...,...,...,...
145,2023,otros,puno,5610,puno,1217951,460.609663
146,2023,otros,san martin,6253,san martin,935194,668.631321
147,2023,otros,tacna,4002,tacna,390279,1025.420276
148,2023,otros,tumbes,2788,tumbes,263164,1059.415422


In [31]:
#agrupa por departamento y año dd_inseguridad_2019 y crea 6 columnas nuevas con la incidencia de cada generico
dd_inseguridad_2019 = dd_inseguridad_2019.pivot_table(index=["dpto_pjfs", "total_2019", "anio_denuncia"], columns="generico", values="incidencia", fill_value=0).reset_index()

dd_inseguridad_2019

generico,dpto_pjfs,total_2019,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,423863,2019,631.807919,169.630281,147.453304,4.48258,973.899585,617.888327
1,ancash,1169522,2019,1038.629457,209.316285,221.629007,5.386816,1479.493331,936.365455
2,apurimac,429587,2019,811.244288,190.648227,278.639717,9.078487,1933.484952,709.984241
3,arequipa,1464638,2019,1072.346887,200.117708,278.840232,8.329703,2545.543677,598.509666
4,ayacucho,664494,2019,881.573047,197.593959,218.21115,5.267166,1681.730761,732.286522
5,cajamarca,1447891,2019,420.335509,101.734178,86.884993,1.726649,689.692801,355.689758
6,callao,1105512,2019,1211.474864,214.742129,292.443682,6.874643,1489.264703,450.922288
7,cusco,1340457,2019,828.001197,175.387946,392.701892,4.028477,1636.009212,560.182087
8,huancavelica,371260,2019,295.480256,71.109196,52.523838,2.962883,634.865054,415.072995
9,huanuco,759851,2019,754.490025,190.958491,314.008931,3.948142,1430.938434,709.217991


In [32]:
dd_inseguridad_2020 = dd_inseguridad_2020.pivot_table(index=["dpto_pjfs", "total_2020", "anio_denuncia"], columns="generico", values="incidencia", fill_value=0).reset_index()
dd_inseguridad_2020

generico,dpto_pjfs,total_2020,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,426806,2020,497.181389,146.202256,212.508728,3.280179,733.822861,406.976472
1,ancash,1180638,2020,649.479349,134.842348,227.165312,5.674898,1045.705796,494.309009
2,apurimac,430736,2020,590.152669,142.778872,238.429107,9.750752,1456.808811,463.39289
3,arequipa,1497438,2020,591.476909,106.648823,221.778798,3.67294,1019.274254,315.872844
4,ayacucho,668213,2020,469.610738,90.091034,139.177179,4.788892,854.21864,377.723869
5,cajamarca,1453711,2020,265.940066,78.695146,72.572884,1.513368,489.712192,209.257548
6,callao,1129854,2020,850.286851,179.226697,288.355841,4.779379,1345.041041,285.70063
7,cusco,1357075,2020,531.289722,125.858925,262.623657,3.315955,1064.716394,327.321629
8,huancavelica,365317,2020,235.13825,54.473238,99.365756,4.106023,582.507795,293.170041
9,huanuco,760267,2020,528.498541,143.765282,309.759598,2.630655,1103.03354,500.219002


In [33]:
dd_inseguridad_2021 = dd_inseguridad_2021.pivot_table(index=["dpto_pjfs", "total_2021", "anio_denuncia"], columns="generico", values="incidencia", fill_value=0).reset_index()
dd_inseguridad_2021

generico,dpto_pjfs,total_2021,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,428512,2021,990.404003,219.597117,221.230677,8.167799,1136.490927,688.428795
1,ancash,1188391,2021,926.210313,178.140023,248.234798,6.058612,1288.464823,694.468403
2,apurimac,430609,2021,859.48041,197.394852,286.803109,12.540379,1877.108932,659.995495
3,arequipa,1526669,2021,1183.098628,237.838064,344.082444,7.729246,1974.494799,632.357112
4,ayacucho,669979,2021,1036.450396,228.216108,270.157721,9.851055,1509.002521,698.827874
5,cajamarca,1455245,2021,426.388684,109.809688,94.623242,2.405093,667.516466,329.910084
6,callao,1151480,2021,1219.474068,272.866224,349.810678,8.250252,1943.759336,458.800848
7,cusco,1369932,2021,686.384434,163.000791,412.867208,3.503824,1310.940981,468.344414
8,huancavelica,358356,2021,308.63164,96.831084,204.545201,8.092511,709.908583,465.179877
9,huanuco,758416,2021,907.813126,238.127888,463.202253,32.436025,1410.175946,689.72701


In [34]:
dd_inseguridad_2022 = dd_inseguridad_2022.pivot_table(index=["dpto_pjfs", "total_2022", "anio_denuncia"], columns="generico", values="incidencia", fill_value=0).reset_index()
dd_inseguridad_2022

generico,dpto_pjfs,total_2022,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,429483,2022,894.331091,237.960525,156.467194,7.450819,1068.49398,835.888731
1,ancash,1194156,2022,1126.318504,205.417048,224.426289,7.034257,1294.805704,961.934622
2,apurimac,429720,2022,646.234758,148.70148,191.52006,9.075677,1283.393838,663.222564
3,arequipa,1553994,2022,1451.035203,248.585258,321.236762,9.202095,1504.960766,750.195947
4,ayacucho,670579,2022,1143.936807,232.933032,222.345167,15.95636,1419.2213,672.702247
5,cajamarca,1454217,2022,454.677672,107.618052,116.832632,2.062966,595.234411,380.135839
6,callao,1171648,2022,1126.276834,166.517589,586.86568,6.31589,1032.477331,661.802862
7,cusco,1380594,2022,749.31515,199.62422,339.491552,4.997849,1293.356338,574.535309
8,huancavelica,350845,2022,326.639969,107.454859,171.015691,9.120837,706.864855,536.13419
9,huanuco,755213,2022,1155.832858,254.365325,568.448901,18.670229,1366.766727,869.29118


In [35]:
dd_inseguridad_2023 = dd_inseguridad_2023.pivot_table(index=["dpto_pjfs", "total_2023", "anio_denuncia"], columns="generico", values="incidencia", fill_value=0).reset_index()
dd_inseguridad_2023

generico,dpto_pjfs,total_2023,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,429943,2023,988.270538,261.197415,178.163152,7.210258,1157.36272,874.301942
1,ancash,1198547,2023,1209.881632,218.848322,224.021252,5.006062,1370.993378,974.930478
2,apurimac,428311,2023,911.020263,209.660737,240.012514,35.955182,1694.796538,868.2943
3,arequipa,1580075,2023,1724.032087,264.417828,363.653624,11.328576,1583.342563,769.710299
4,ayacucho,670377,2023,1380.864797,267.163104,329.665248,20.287092,1474.394259,776.428786
5,cajamarca,1451436,2023,596.512695,121.05253,110.097862,3.100378,627.447576,435.706431
6,callao,1190860,2023,1534.689216,285.927817,572.359471,9.824832,1490.183565,804.460642
7,cusco,1389737,2023,923.627996,201.620882,411.876492,7.699299,1272.470978,640.480897
8,huancavelica,343026,2023,308.431431,89.206066,96.20262,42.270848,618.320477,549.229504
9,huanuco,751097,2023,1410.869701,261.217925,561.978013,25.56261,1421.520789,931.437617


In [36]:
# eliminar columna total_2019, total_2020, total_2021, total_2022, total_2023
dd_inseguridad_2019 = dd_inseguridad_2019.drop(columns=["total_2019"])
dd_inseguridad_2020 = dd_inseguridad_2020.drop(columns=["total_2020"])
dd_inseguridad_2021 = dd_inseguridad_2021.drop(columns=["total_2021"])
dd_inseguridad_2022 = dd_inseguridad_2022.drop(columns=["total_2022"])
dd_inseguridad_2023 = dd_inseguridad_2023.drop(columns=["total_2023"])


In [37]:
# apilar los dataframes 
dd_incidencia = pd.concat([dd_inseguridad_2019, dd_inseguridad_2020, dd_inseguridad_2021, dd_inseguridad_2022, dd_inseguridad_2023])
dd_incidencia = dd_incidencia.reset_index(drop=True)
dd_incidencia

generico,dpto_pjfs,anio_denuncia,contra el patrimonio,contra la libertad,contra la seguridad publica,contra la tranquilidad publica,contra la vida/el cuerpo y la salud,otros
0,amazonas,2019,631.807919,169.630281,147.453304,4.482580,973.899585,617.888327
1,ancash,2019,1038.629457,209.316285,221.629007,5.386816,1479.493331,936.365455
2,apurimac,2019,811.244288,190.648227,278.639717,9.078487,1933.484952,709.984241
3,arequipa,2019,1072.346887,200.117708,278.840232,8.329703,2545.543677,598.509666
4,ayacucho,2019,881.573047,197.593959,218.211150,5.267166,1681.730761,732.286522
...,...,...,...,...,...,...,...,...
120,puno,2023,526.540066,89.248254,155.178657,12.069451,715.299712,460.609663
121,san martin,2023,934.351589,249.360026,153.764887,7.912797,1099.237164,668.631321
122,tacna,2023,1320.593729,231.629168,311.315751,7.686809,1398.486724,1025.420276
123,tumbes,2023,847.380341,164.536183,737.942880,2.659938,1185.192504,1059.415422


In [38]:
# renombrar las columnas "contra la vida/el cuerpo y la salud","contra la libertad","contra el patrimonio","contra la tranquilidad publica", "contra la seguridad publica" y "otros"
dd_incidencia = dd_incidencia.rename(columns={
    "contra la vida/el cuerpo y la salud": "incidencia_vida",
    "contra la libertad": "incidencia_libertad",
    "contra el patrimonio": "incidencia_patrimonio",
    "contra la tranquilidad publica": "incidencia_tranquilidad",
    "contra la seguridad publica": "incidencia_seguridad",
    "otros": "incidencia_otros"
})
dd_incidencia

generico,dpto_pjfs,anio_denuncia,incidencia_patrimonio,incidencia_libertad,incidencia_seguridad,incidencia_tranquilidad,incidencia_vida,incidencia_otros
0,amazonas,2019,631.807919,169.630281,147.453304,4.482580,973.899585,617.888327
1,ancash,2019,1038.629457,209.316285,221.629007,5.386816,1479.493331,936.365455
2,apurimac,2019,811.244288,190.648227,278.639717,9.078487,1933.484952,709.984241
3,arequipa,2019,1072.346887,200.117708,278.840232,8.329703,2545.543677,598.509666
4,ayacucho,2019,881.573047,197.593959,218.211150,5.267166,1681.730761,732.286522
...,...,...,...,...,...,...,...,...
120,puno,2023,526.540066,89.248254,155.178657,12.069451,715.299712,460.609663
121,san martin,2023,934.351589,249.360026,153.764887,7.912797,1099.237164,668.631321
122,tacna,2023,1320.593729,231.629168,311.315751,7.686809,1398.486724,1025.420276
123,tumbes,2023,847.380341,164.536183,737.942880,2.659938,1185.192504,1059.415422


In [None]:
# #guardar el dataframe en un archivo csv
# dd_incidencia.to_csv("incidencia_delitos.csv", index=False)