# OPI analytics
## Mexico City's crime exploratory analysis

In [26]:
## Dependencies
import pandas as pd
import matplotlib.pyplot as plt

### A. Data collection

In [2]:
## Import data from FGJ open cases CSV file
## Reference: https://datos.cdmx.gob.mx/dataset/carpetas-de-investigacion-fgj-de-la-ciudad-de-mexico/resource/48fcb848-220c-4af0-839b-4fd8ac812c0f
FGJ_data = pd.read_csv('data/carpetas_completa_septiembre_2021.csv', low_memory=False)

### B. Data exploration

In [3]:
FGJ_data.head(3)

Unnamed: 0,ao_hechos,mes_hechos,fecha_hechos,ao_inicio,mes_inicio,fecha_inicio,delito,fiscalia,agencia,unidad_investigacion,categoria_delito,calle_hechos,calle_hechos2,colonia_hechos,alcaldia_hechos,competencia,longitud,latitud,tempo
0,2016.0,Enero,2016-01-31 22:16:00,2016,Febrero,2016-02-01 00:25:44,DAÑO EN PROPIEDAD AJENA INTENCIONAL,INVESTIGACIÓN EN BENITO JUÁREZ,BJ-2,UI-3CD,DELITO DE BAJO IMPACTO,CALZ. DE TLALPAN,LAGO PTE.,AMÉRICAS UNIDAS,BENITO JUAREZ,,-99.140215,19.380315,
1,2016.0,Enero,2016-01-31 20:50:00,2016,Febrero,2016-02-01 00:52:37,ROBO DE VEHICULO DE SERVICIO PARTICULAR CON VI...,INVESTIGACIÓN PARA LA ATENCIÓN DEL DELITO DE R...,ORIENTEII,UI-3CD,ROBO DE VEHÍCULO CON Y SIN VIOLENCIA,SUR 25 A,GRANJEROS,LOS CIPRESES,IZTAPALAPA,,-99.108403,19.352859,
2,2016.0,Febrero,2016-02-01 00:30:00,2016,Febrero,2016-02-01 01:33:26,NARCOMENUDEO POSESION SIMPLE,"INVESTIGACIÓN PARA LA ATENCIÓN DE NIÑOS, NIÑAS...",57,UI-3CD,DELITO DE BAJO IMPACTO,BATALLONES ROJOS,,UNIDAD VICENTE GUERRERO,IZTAPALAPA,,-99.061321,19.356451,


In [4]:
FGJ_data.tail(3)

Unnamed: 0,ao_hechos,mes_hechos,fecha_hechos,ao_inicio,mes_inicio,fecha_inicio,delito,fiscalia,agencia,unidad_investigacion,categoria_delito,calle_hechos,calle_hechos2,colonia_hechos,alcaldia_hechos,competencia,longitud,latitud,tempo
1307208,2021.0,Septiembre,2021-09-07 20:47:00,2021,Septiembre,2021-09-30 23:54:06,DAÑO EN PROPIEDAD AJENA CULPOSA,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN IZTAP...,IZP-6,UI-2CD,DELITO DE BAJO IMPACTO,CALZADA IGNACIO ZARAGOZA,,AREA FEDERAL PARQUE ECOLOGICO EL SALADO,IZTAPALAPA,FUERO COMUN,-99.009789,19.368632,
1307209,2021.0,Septiembre,2021-09-03 17:10:00,2021,Septiembre,2021-09-30 23:54:18,ROBO A REPARTIDOR CON VIOLENCIA,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN GUSTA...,UAT-GAM-2,UI-1SD,ROBO A REPARTIDOR CON Y SIN VIOLENCIA,ZACAPOAXTLA,,SAN FELIPE DE JESÚS,GUSTAVO A MADERO,FUERO COMUN,-99.069949,19.491604,
1307210,2021.0,Septiembre,2021-09-30 23:20:00,2021,Septiembre,2021-09-30 23:54:45,ROBO A TRANSEUNTE EN VIA PUBLICA CON VIOLENCIA,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN AZCAP...,AZ-2,UI-2CD,ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIO...,CALZADA SANTIAGO AHUIZOTLA,MORELOS,SANTIAGO AHUIZOTLA,AZCAPOTZALCO,FUERO COMUN,-99.209475,19.476235,


In [5]:
FGJ_data.shape

(1307211, 19)

In [6]:
FGJ_data.describe()

Unnamed: 0,ao_hechos,ao_inicio,longitud,latitud,tempo
count,1306767.0,1307211.0,1253509.0,1253509.0,0.0
mean,2018.268,2018.419,-99.13722,19.38718,
std,1.914601,1.612246,0.0600081,0.07006171,
min,1906.0,2016.0,-100.2319,19.09535,
25%,2017.0,2017.0,-99.17561,19.33937,
50%,2018.0,2018.0,-99.14208,19.38967,
75%,2020.0,2020.0,-99.09959,19.43776,
max,2021.0,2021.0,-98.94686,19.58333,


In [7]:
FGJ_data.isna().any()

ao_hechos                True
mes_hechos               True
fecha_hechos             True
ao_inicio               False
mes_inicio              False
fecha_inicio             True
delito                  False
fiscalia                 True
agencia                 False
unidad_investigacion     True
categoria_delito        False
calle_hechos             True
calle_hechos2            True
colonia_hechos           True
alcaldia_hechos          True
competencia              True
longitud                 True
latitud                  True
tempo                    True
dtype: bool

In [8]:
FGJ_data.dtypes

ao_hechos               float64
mes_hechos               object
fecha_hechos             object
ao_inicio                 int64
mes_inicio               object
fecha_inicio             object
delito                   object
fiscalia                 object
agencia                  object
unidad_investigacion     object
categoria_delito         object
calle_hechos             object
calle_hechos2            object
colonia_hechos           object
alcaldia_hechos          object
competencia              object
longitud                float64
latitud                 float64
tempo                   float64
dtype: object

In [9]:
FGJ_data[['delito', 'fiscalia', 'agencia','categoria_delito','alcaldia_hechos','competencia']].nunique()

delito              345
fiscalia             73
agencia             209
categoria_delito     18
alcaldia_hechos     557
competencia           3
dtype: int64

In [10]:
FGJ_data.delito.value_counts()

VIOLENCIA FAMILIAR                                                        137582
FRAUDE                                                                     82032
ROBO DE OBJETOS                                                            75973
AMENAZAS                                                                   71595
ROBO A NEGOCIO SIN VIOLENCIA                                               67547
                                                                           ...  
CONTRA LA LEY GENERAL DE EXPLOSIVOS                                            1
ASOCIACION DELICTUOSA                                                          1
HOMICIDIO INTENCIONAL Y ROBO DE VEHICULO                                       1
PROCREACION ASISTIDA, INSEMINACION ARTIFICIAL Y ESTERILIZACION FORZADA         1
EJERCICIO INDEBIDO DEL PROPIO DER.                                             1
Name: delito, Length: 345, dtype: int64

In [11]:
FGJ_data.fiscalia.value_counts()

INVESTIGACIÓN EN IZTAPALAPA                                                                             114947
INVESTIGACIÓN EN CUAUHTEMOC                                                                             114405
INVESTIGACIÓN EN GUSTAVO A. MADERO                                                                       78355
INVESTIGACIÓN EN BENITO JUÁREZ                                                                           74528
INVESTIGACIÓN EN ÁLVARO OBREGÓN                                                                          54129
                                                                                                         ...  
FISCALÍA ESPECIALIZADA PARA LA INVESTIGACIÓN DEL DELITO DE FEMINICIDIO                                     134
UNIDAD DE RECEPCION POR INTERNET                                                                            55
ESPECIALIZADA EN LA BÚSQUEDA, LOCALIZACIÓN E INVESTIGACIÓN DE PERSONAS DESAPARECIDAS                        43
F

In [12]:
FGJ_data.categoria_delito.value_counts()

DELITO DE BAJO IMPACTO                                     1026209
ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIOLENCIA         73481
ROBO DE VEHÍCULO CON Y SIN VIOLENCIA                         67522
HECHO NO DELICTIVO                                           57857
ROBO A NEGOCIO CON VIOLENCIA                                 21136
ROBO A REPARTIDOR CON Y SIN VIOLENCIA                        13362
ROBO A PASAJERO A BORDO DEL METRO CON Y SIN VIOLENCIA        11469
LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO                 9306
HOMICIDIO DOLOSO                                              7412
VIOLACIÓN                                                     7344
ROBO A PASAJERO A BORDO DE MICROBUS CON Y SIN VIOLENCIA       4293
ROBO A CASA HABITACIÓN CON VIOLENCIA                          3256
ROBO A CUENTAHABIENTE SALIENDO DEL CAJERO CON VIOLENCIA       2386
ROBO A PASAJERO A BORDO DE TAXI CON VIOLENCIA                 1299
ROBO A TRANSPORTISTA CON Y SIN VIOLENCIA                      

In [13]:
FGJ_data.alcaldia_hechos.value_counts()

CUAUHTEMOC          203425
IZTAPALAPA          196158
GUSTAVO A MADERO    131319
BENITO JUAREZ       107516
ALVARO OBREGON       88946
                     ...  
PUNGARABATO              1
TOLCAYUCA                1
CHIGNAHUAPAN             1
XICOTEPEC                1
ECUANDUREO               1
Name: alcaldia_hechos, Length: 557, dtype: int64

In [14]:
FGJ_data.competencia.value_counts()

FUERO COMUN           236246
HECHO NO DELICTIVO      4341
INCOMPETENCIA           2545
Name: competencia, dtype: int64

### 1. Define analysis time frame

In [49]:
## Crime incidence for the last 20 years (number of registers in FGJ db) 
year_incidence = FGJ_data.ao_hechos.value_counts()
year_incidence[year_incidence.index >= 1991].sort_index(ascending=False)

2021.0    155919
2020.0    201527
2019.0    243898
2018.0    254013
2017.0    227268
2016.0    195010
2015.0     15993
2014.0      4313
2013.0      2204
2012.0      1577
2011.0      1080
2010.0       903
2009.0       499
2008.0       482
2007.0       327
2006.0       268
2005.0       199
2004.0       169
2003.0       118
2002.0       113
2001.0       203
2000.0       112
1999.0        48
1998.0        60
1997.0        41
1996.0        31
1995.0        33
1994.0        24
1993.0        27
1992.0        35
1991.0        18
1990.0        28
Name: ao_hechos, dtype: int64

In [50]:
FGJ_data[['ao_hechos','mes_hechos','competencia']].loc[FGJ_data['ao_hechos'] > 2000].sort_values(['ao_hechos','mes_hechos'])

Unnamed: 0,ao_hechos,mes_hechos,competencia
51471,2001.0,Abril,
77416,2001.0,Abril,
113600,2001.0,Abril,
403700,2001.0,Abril,
505155,2001.0,Abril,
...,...,...,...
1307206,2021.0,Septiembre,HECHO NO DELICTIVO
1307207,2021.0,Septiembre,FUERO COMUN
1307208,2021.0,Septiembre,FUERO COMUN
1307209,2021.0,Septiembre,FUERO COMUN


In [51]:
FGJ_data[['ao_hechos','mes_hechos','competencia']].loc[FGJ_data['ao_hechos'] > 2000].dropna().sort_values(['ao_hechos','mes_hechos'])

Unnamed: 0,ao_hechos,mes_hechos,competencia
1165017,2001.0,Abril,FUERO COMUN
1189907,2001.0,Abril,FUERO COMUN
1288369,2001.0,Abril,FUERO COMUN
1218923,2001.0,Agosto,FUERO COMUN
1270584,2001.0,Agosto,FUERO COMUN
...,...,...,...
1307206,2021.0,Septiembre,HECHO NO DELICTIVO
1307207,2021.0,Septiembre,FUERO COMUN
1307208,2021.0,Septiembre,FUERO COMUN
1307209,2021.0,Septiembre,FUERO COMUN


In [63]:
FGJ_data.loc[(FGJ_data['ao_hechos'] >= 2014) & (FGJ_data['ao_hechos'] <= 2017)].groupby(['ao_hechos','mes_hechos']).count()['delito']

ao_hechos  mes_hechos
2014.0     Abril           323
           Agosto          323
           Diciembre       426
           Enero           331
           Febrero         256
           Julio           337
           Junio           327
           Marzo           326
           Mayo            469
           Noviembre       392
           Octubre         449
           Septiembre      354
2015.0     Abril           696
           Agosto         1143
           Diciembre      3563
           Enero          1143
           Febrero         707
           Julio           946
           Junio           983
           Marzo           737
           Mayo            884
           Noviembre      2134
           Octubre        1723
           Septiembre     1334
2016.0     Abril         16413
           Agosto        16623
           Diciembre     16144
           Enero         15171
           Febrero       15505
           Julio         15477
           Junio         15260
           Marzo 