# Análsis de carpetas de investigación del 2023

Estos datos corresponden al periodo del 01/Enero/2023 al 31/Marzo/2023

In [199]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sb

### Entendimiento de los datos

In [200]:
df = pd.read_csv('data/da_2023.csv')
df.shape

(64344, 22)

In [201]:
df.columns

Index(['idCarpeta', 'Año_inicio', 'Mes_inicio', 'FechaInicio', 'Delito',
       'Categoria', 'Sexo', 'Edad', 'TipoPersona', 'CalidadJuridica',
       'competencia', 'Año_hecho', 'Mes_hecho', 'FechaHecho', 'HoraHecho',
       'HoraInicio', 'alcaldia_hechos', 'municipio_hechos', 'colonia_datos',
       'fgj_colonia_registro', 'latitud', 'longitud'],
      dtype='object')

In [202]:
df.head()

Unnamed: 0,idCarpeta,Año_inicio,Mes_inicio,FechaInicio,Delito,Categoria,Sexo,Edad,TipoPersona,CalidadJuridica,...,Mes_hecho,FechaHecho,HoraHecho,HoraInicio,alcaldia_hechos,municipio_hechos,colonia_datos,fgj_colonia_registro,latitud,longitud
0,9361878,2023,Enero,2023-01-01,LESIONES CULPOSAS POR TRANSITO VEHICULAR EN CO...,DELITO DE BAJO IMPACTO,,,MORAL,OFENDIDO,...,Diciembre,2022-12-31,22:08:00,00:09:00,COYOACAN,,INSURGENTES CUICUILCO,INSURGENTES CUICUILCO,19.305532,-99.186308
1,9361879,2023,Enero,2023-01-01,ROBO A TRANSEUNTE EN VIA PUBLICA CON VIOLENCIA,ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIO...,Masculino,50.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,2022-12-31,23:50:00,00:41:00,VENUSTIANO CARRANZA,,MOCTEZUMA 2A SECCION IV,MOCTEZUMA 2A SECCIÓN,19.429797,-99.098672
2,9361880,2023,Enero,2023-01-01,ROBO DE VEHICULO DE SERVICIO PARTICULAR CON VI...,ROBO DE VEHÍCULO CON Y SIN VIOLENCIA,Masculino,34.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,2022-12-31,20:30:00,00:44:00,GUSTAVO A. MADERO,,SAN JUAN DE ARAGON 3A SECCION (U HAB) I,SAN JUAN DE ARAGÓN III SECCIÓN,19.451641,-99.076529
3,9361881,2023,Enero,2023-01-01,LESIONES CULPOSAS POR TRANSITO VEHICULAR EN CO...,DELITO DE BAJO IMPACTO,Masculino,,FISICA,LESIONADO,...,Diciembre,2022-12-31,23:30:00,00:47:00,COYOACAN,,XOTEPINGO,XOTEPINGO,19.323245,-99.138016
4,9361882,2023,Enero,2023-01-01,PERDIDA DE LA VIDA POR OTRAS CAUSAS,HECHO NO DELICTIVO,Masculino,90.0,FISICA,CADAVER,...,Diciembre,2022-12-31,10:30:00,00:56:00,GUSTAVO A. MADERO,,,,,


In [203]:
df.dtypes

idCarpeta                 int64
Año_inicio                int64
Mes_inicio               object
FechaInicio              object
Delito                   object
Categoria                object
Sexo                     object
Edad                    float64
TipoPersona              object
CalidadJuridica          object
competencia              object
Año_hecho               float64
Mes_hecho                object
FechaHecho               object
HoraHecho                object
HoraInicio               object
alcaldia_hechos          object
municipio_hechos         object
colonia_datos            object
fgj_colonia_registro     object
latitud                 float64
longitud                float64
dtype: object

In [204]:
df.nunique()

idCarpeta               61333
Año_inicio                  1
Mes_inicio                  3
FechaInicio                90
Delito                    255
Categoria                  16
Sexo                        2
Edad                      100
TipoPersona                 2
CalidadJuridica             5
competencia                 3
Año_hecho                  39
Mes_hecho                  12
FechaHecho               1434
HoraHecho                1441
HoraInicio               1455
alcaldia_hechos            18
municipio_hechos           91
colonia_datos            1655
fgj_colonia_registro     1538
latitud                 57654
longitud                57653
dtype: int64

In [205]:
df["Año_hecho"].describe()

count    64337.000000
mean      2022.731616
std          1.271916
min       1962.000000
25%       2023.000000
50%       2023.000000
75%       2023.000000
max       2023.000000
Name: Año_hecho, dtype: float64

### Tenemos delitos cometidos desde el año **1962** a los cuáles se les abrió carpetas de investigación hasta el año **2023**

In [206]:
df["Año_hecho"].unique()

array([2022., 2023., 2021., 2018., 2019., 2020., 2013., 1998., 2007.,
       2017., 2014., 2015., 2010., 2011.,   nan, 2003., 2016., 2005.,
       2000., 2006., 1993., 1995., 2012., 2002., 2008., 1969., 1987.,
       2009., 1967., 1990., 1999., 2004., 1994., 1974., 1976., 1985.,
       1962., 1991., 1972., 2001.])

In [207]:
df["Categoria"].unique()

array(['DELITO DE BAJO IMPACTO',
       'ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIOLENCIA',
       'ROBO DE VEHÍCULO CON Y SIN VIOLENCIA', 'HECHO NO DELICTIVO',
       'LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO', 'VIOLACIÓN',
       'ROBO A NEGOCIO CON VIOLENCIA',
       'ROBO A REPARTIDOR CON Y SIN VIOLENCIA', 'HOMICIDIO DOLOSO',
       'ROBO A PASAJERO A BORDO DE MICROBUS CON Y SIN VIOLENCIA',
       'ROBO A PASAJERO A BORDO DEL METRO CON Y SIN VIOLENCIA',
       'ROBO A PASAJERO A BORDO DE TAXI CON VIOLENCIA',
       'ROBO A CUENTAHABIENTE SALIENDO DEL CAJERO CON VIOLENCIA',
       'ROBO A CASA HABITACIÓN CON VIOLENCIA',
       'ROBO A TRANSPORTISTA CON Y SIN VIOLENCIA', 'SECUESTRO'],
      dtype=object)

In [208]:
df.loc[df["Año_hecho"]==1962]

Unnamed: 0,idCarpeta,Año_inicio,Mes_inicio,FechaInicio,Delito,Categoria,Sexo,Edad,TipoPersona,CalidadJuridica,...,Mes_hecho,FechaHecho,HoraHecho,HoraInicio,alcaldia_hechos,municipio_hechos,colonia_datos,fgj_colonia_registro,latitud,longitud
44757,9408996,2023,Marzo,2023-03-06,AMENAZAS,DELITO DE BAJO IMPACTO,Masculino,60.0,FISICA,VICTIMA Y DENUNCIANTE,...,Septiembre,1962-09-11,13:45:00,18:39:00,COYOACAN,,DEL CARMEN,DEL CARMEN,19.351477,-99.158951


In [209]:
df["competencia"].unique()

array(['FUERO COMUN', 'HECHOS NO DELICTIVOS', 'INCOMPETENCIAS'],
      dtype=object)

## Resumen del entendimiento de los datos

1. Existen carpetas de investigación sobre delitos cometidos desde 1962, abiertas hasta el 2023.

2. Tenemos **16 categorías de delitos**.

3. Hay **5 tipos de calidades jurídicas**.

4. Describiendo los **3 competencias de delitos**:
    
    * Fuero común: Aquellos delitos que afectas directamente a la persona.
    * Hechos no delictivos: No son delitos.
    * Incompetencias: La persona es incapaz de ser juzgada o de ser responsable de sus acciones debido a condiciones físicas o mentales.
    
    
    
5. En la columna de alcaldías estamos considerando un **extra llamado 'fuera de la ciudad de méxico'**

6. Tenemos **255 tipos de delitos**.

---

#### Recomendaciones en el proceso de limpieza

- Eliminar las siguientes columnas:
    
        1. idCarpeta
        
        
- Renombrar las siguientes columnas:

        1. Año_hecho
        2. Año_inicio
        3.fgj_colonia_registro
        

- Cambiar el tipo de dato a la columna edades y al año_hecho

- Estandarizar los nombres de las columnas a minusculas

In [210]:
df = df.rename(columns={'Año_hecho':'año_delito',
                        'Año_inicio':'año_carpeta',
                        'fgj_colonia_registro':'colonia'})
df.columns

Index(['idCarpeta', 'año_carpeta', 'Mes_inicio', 'FechaInicio', 'Delito',
       'Categoria', 'Sexo', 'Edad', 'TipoPersona', 'CalidadJuridica',
       'competencia', 'año_delito', 'Mes_hecho', 'FechaHecho', 'HoraHecho',
       'HoraInicio', 'alcaldia_hechos', 'municipio_hechos', 'colonia_datos',
       'colonia', 'latitud', 'longitud'],
      dtype='object')

In [211]:
df.head()

Unnamed: 0,idCarpeta,año_carpeta,Mes_inicio,FechaInicio,Delito,Categoria,Sexo,Edad,TipoPersona,CalidadJuridica,...,Mes_hecho,FechaHecho,HoraHecho,HoraInicio,alcaldia_hechos,municipio_hechos,colonia_datos,colonia,latitud,longitud
0,9361878,2023,Enero,2023-01-01,LESIONES CULPOSAS POR TRANSITO VEHICULAR EN CO...,DELITO DE BAJO IMPACTO,,,MORAL,OFENDIDO,...,Diciembre,2022-12-31,22:08:00,00:09:00,COYOACAN,,INSURGENTES CUICUILCO,INSURGENTES CUICUILCO,19.305532,-99.186308
1,9361879,2023,Enero,2023-01-01,ROBO A TRANSEUNTE EN VIA PUBLICA CON VIOLENCIA,ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIO...,Masculino,50.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,2022-12-31,23:50:00,00:41:00,VENUSTIANO CARRANZA,,MOCTEZUMA 2A SECCION IV,MOCTEZUMA 2A SECCIÓN,19.429797,-99.098672
2,9361880,2023,Enero,2023-01-01,ROBO DE VEHICULO DE SERVICIO PARTICULAR CON VI...,ROBO DE VEHÍCULO CON Y SIN VIOLENCIA,Masculino,34.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,2022-12-31,20:30:00,00:44:00,GUSTAVO A. MADERO,,SAN JUAN DE ARAGON 3A SECCION (U HAB) I,SAN JUAN DE ARAGÓN III SECCIÓN,19.451641,-99.076529
3,9361881,2023,Enero,2023-01-01,LESIONES CULPOSAS POR TRANSITO VEHICULAR EN CO...,DELITO DE BAJO IMPACTO,Masculino,,FISICA,LESIONADO,...,Diciembre,2022-12-31,23:30:00,00:47:00,COYOACAN,,XOTEPINGO,XOTEPINGO,19.323245,-99.138016
4,9361882,2023,Enero,2023-01-01,PERDIDA DE LA VIDA POR OTRAS CAUSAS,HECHO NO DELICTIVO,Masculino,90.0,FISICA,CADAVER,...,Diciembre,2022-12-31,10:30:00,00:56:00,GUSTAVO A. MADERO,,,,,


---
## **Delitos y sus cifras**

In [212]:
# tipos de delitos y su incidencia
df['Delito'].value_counts()

VIOLENCIA FAMILIAR                                                       10266
FRAUDE                                                                    5794
AMENAZAS                                                                  5253
ROBO DE OBJETOS                                                           3407
ROBO DE ACCESORIOS DE AUTO                                                2759
                                                                         ...  
ROBO A PASAJERO EN AUTOBÚS FORÁNEO CON VIOLENCIA                             1
ROBO A TRANSPORTISTA Y VEHICULO PESADO SIN VIOLENCIA                         1
ROBO DE VEHICULO DE SERVICIO OFICIAL CON VIOLENCIA                           1
ROBO A PASAJERO EN AUTOBUS FORANEO SIN VIOLENCIA                             1
FABRICACION, COMERCIALIZACION Y USO INDEBIDO DE INSIGNIAS Y UNIFORMES        1
Name: Delito, Length: 255, dtype: int64

In [213]:
#incidencia por categoría
df['Categoria'].value_counts()

DELITO DE BAJO IMPACTO                                     56212
ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIOLENCIA        2611
ROBO DE VEHÍCULO CON Y SIN VIOLENCIA                        1565
HECHO NO DELICTIVO                                          1011
VIOLACIÓN                                                    745
ROBO A NEGOCIO CON VIOLENCIA                                 534
ROBO A PASAJERO A BORDO DEL METRO CON Y SIN VIOLENCIA        381
ROBO A REPARTIDOR CON Y SIN VIOLENCIA                        340
HOMICIDIO DOLOSO                                             289
ROBO A PASAJERO A BORDO DE MICROBUS CON Y SIN VIOLENCIA      215
LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO                214
ROBO A CASA HABITACIÓN CON VIOLENCIA                          69
ROBO A CUENTAHABIENTE SALIENDO DEL CAJERO CON VIOLENCIA       59
ROBO A PASAJERO A BORDO DE TAXI CON VIOLENCIA                 43
SECUESTRO                                                     38
ROBO A TRANSPORTISTA CON 

---
## 2019-2020 


In [214]:
df2223 = pd.read_csv('data/carpetas20222023.csv')
df2223.shape

(301038, 20)

In [215]:
df2223.head()

Unnamed: 0,ao_hechos,mes_hechos,fecha_hechos,hora_hechos,ao_inicio,mes_inicio,fecha_inicio,hora_inicio,delito,fiscalia,agencia,unidad_investigacion,categoria_delito,competencia,alcaldia_hechos,municipio_hechos,colonia_datos,fgj_colonia_registro,longitud,latitud
0,2021.0,Diciembre,2021-12-31,23:00:00,2022,Enero,2022-01-01,00:03:00,ROBO A TRANSEUNTE EN VIA PUBLICA CON VIOLENCIA,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN ALVAR...,AO-3,UI-1CD,ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIO...,FUERO COMUN,ALVARO OBREGON,,LIBERALES DE 1857,LIBERALES DE 1857,-99.21295,19.39444
1,2021.0,Octubre,2021-10-29,09:00:00,2022,Enero,2022-01-01,00:06:00,ABUSO DE CONFIANZA,AGENCIA DE DENUNCIA DIGITAL,CEN-1,Unidad de Investigación 1 S/D,DELITO DE BAJO IMPACTO,FUERO COMUN,COYOACAN,,SANTA URSULA COAPA (PBLO),PUEBLO DE SANTA URSULA COAPA,-99.14214,19.31311
2,2021.0,Diciembre,2021-12-31,22:30:00,2022,Enero,2022-01-01,00:26:00,LESIONES INTENCIONALES POR ARMA DE FUEGO,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN GUSTA...,UAT-GAM-3,UI-1SD,LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO,FUERO COMUN,VENUSTIANO CARRANZA,,MORELOS I,MORELOS,-99.12139,19.44615
3,2021.0,Diciembre,2021-12-31,23:11:00,2022,Enero,2022-01-01,00:29:00,DAÑO EN PROPIEDAD AJENA CULPOSA POR TRÁNSITO V...,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN BENIT...,BJ-2,UI-1CD,DELITO DE BAJO IMPACTO,FUERO COMUN,BENITO JUAREZ,,DEL VALLE VII,DEL VALLE CENTRO,-99.17495,19.36963
4,2021.0,Diciembre,2021-12-31,21:30:00,2022,Enero,2022-01-01,00:35:00,VIOLENCIA FAMILIAR,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN GUSTA...,UAT-GAM-3,UI-1SD,DELITO DE BAJO IMPACTO,FUERO COMUN,GUSTAVO A. MADERO,,LA FORESTAL,FORESTAL,-99.1299,19.55972


In [216]:
df2223.dtypes

ao_hechos               float64
mes_hechos               object
fecha_hechos             object
hora_hechos              object
ao_inicio                 int64
mes_inicio               object
fecha_inicio             object
hora_inicio              object
delito                   object
fiscalia                 object
agencia                  object
unidad_investigacion     object
categoria_delito         object
competencia              object
alcaldia_hechos          object
municipio_hechos         object
colonia_datos            object
fgj_colonia_registro     object
longitud                float64
latitud                 float64
dtype: object

In [217]:
df2223.rename(columns={'ao_hechos':'Año_delito',
                                   'ao_inicio':'Año_carpeta',
                               'fgj_colonia_registro':'Colonia'},
              inplace=True)

df2223.columns

Index(['Año_delito', 'mes_hechos', 'fecha_hechos', 'hora_hechos',
       'Año_carpeta', 'mes_inicio', 'fecha_inicio', 'hora_inicio', 'delito',
       'fiscalia', 'agencia', 'unidad_investigacion', 'categoria_delito',
       'competencia', 'alcaldia_hechos', 'municipio_hechos', 'colonia_datos',
       'Colonia', 'longitud', 'latitud'],
      dtype='object')

In [218]:
df2223.head()

Unnamed: 0,Año_delito,mes_hechos,fecha_hechos,hora_hechos,Año_carpeta,mes_inicio,fecha_inicio,hora_inicio,delito,fiscalia,agencia,unidad_investigacion,categoria_delito,competencia,alcaldia_hechos,municipio_hechos,colonia_datos,Colonia,longitud,latitud
0,2021.0,Diciembre,2021-12-31,23:00:00,2022,Enero,2022-01-01,00:03:00,ROBO A TRANSEUNTE EN VIA PUBLICA CON VIOLENCIA,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN ALVAR...,AO-3,UI-1CD,ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIO...,FUERO COMUN,ALVARO OBREGON,,LIBERALES DE 1857,LIBERALES DE 1857,-99.21295,19.39444
1,2021.0,Octubre,2021-10-29,09:00:00,2022,Enero,2022-01-01,00:06:00,ABUSO DE CONFIANZA,AGENCIA DE DENUNCIA DIGITAL,CEN-1,Unidad de Investigación 1 S/D,DELITO DE BAJO IMPACTO,FUERO COMUN,COYOACAN,,SANTA URSULA COAPA (PBLO),PUEBLO DE SANTA URSULA COAPA,-99.14214,19.31311
2,2021.0,Diciembre,2021-12-31,22:30:00,2022,Enero,2022-01-01,00:26:00,LESIONES INTENCIONALES POR ARMA DE FUEGO,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN GUSTA...,UAT-GAM-3,UI-1SD,LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO,FUERO COMUN,VENUSTIANO CARRANZA,,MORELOS I,MORELOS,-99.12139,19.44615
3,2021.0,Diciembre,2021-12-31,23:11:00,2022,Enero,2022-01-01,00:29:00,DAÑO EN PROPIEDAD AJENA CULPOSA POR TRÁNSITO V...,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN BENIT...,BJ-2,UI-1CD,DELITO DE BAJO IMPACTO,FUERO COMUN,BENITO JUAREZ,,DEL VALLE VII,DEL VALLE CENTRO,-99.17495,19.36963
4,2021.0,Diciembre,2021-12-31,21:30:00,2022,Enero,2022-01-01,00:35:00,VIOLENCIA FAMILIAR,FISCALÍA DE INVESTIGACIÓN TERRITORIAL EN GUSTA...,UAT-GAM-3,UI-1SD,DELITO DE BAJO IMPACTO,FUERO COMUN,GUSTAVO A. MADERO,,LA FORESTAL,FORESTAL,-99.1299,19.55972


In [227]:
df2223.describe()

Unnamed: 0,Año_delito,Año_carpeta,longitud,latitud
count,300973.0,301038.0,301038.0,301038.0
mean,2021.994617,2022.203738,-93.427414,18.267394
std,3.566753,0.402777,23.09439,4.516074
min,222.0,2022.0,-99.34134,0.0
25%,2022.0,2022.0,-99.17298,19.319991
50%,2022.0,2022.0,-99.13661,19.38053
75%,2022.0,2022.0,-99.08438,19.434184
max,2023.0,2023.0,0.0,19.57888


In [219]:
df2223["Año_delito"].unique()

array([2021., 2022., 2020., 2014., 2018., 2019., 1989., 2017., 2015.,
       2003., 1986., 1996., 1999., 2008., 2002., 2009., 2016., 2010.,
       2001., 2011., 2012., 2013.,   nan, 2006., 1970., 2007., 1969.,
       1995., 2005., 1971., 2004., 1998., 2000., 1992., 1976., 1990.,
       1997., 1988., 1978., 1983., 1994., 1987., 1993.,  222., 1985.,
       1974., 1972., 1982., 1962., 1991., 1980., 1979., 1955., 1984.,
       1981., 1950., 1977., 2023., 1967.])

In [220]:
df2223["Año_delito"].describe()

count    300973.000000
mean       2021.994617
std           3.566753
min         222.000000
25%        2022.000000
50%        2022.000000
75%        2022.000000
max        2023.000000
Name: Año_delito, dtype: float64

In [221]:
df2223['delito'].value_counts()

VIOLENCIA FAMILIAR                                                    47057
FRAUDE                                                                27265
AMENAZAS                                                              23925
ROBO DE OBJETOS                                                       16641
ROBO DE ACCESORIOS DE AUTO                                            11632
                                                                      ...  
HOMICIDIO POR INMERSION                                                   1
CORRUPCION DE MENORES E INCAPACES                                         1
PRIVACIÓN DE LA LIBERTAD PERSONAL  ( SI LIBERA DENTRO DE 24 HORAS)        1
OTROS AMBIENTALES                                                         1
OTROS DELITOS                                                             1
Name: delito, Length: 291, dtype: int64

In [222]:
df2223['categoria_delito'].value_counts()

DELITO DE BAJO IMPACTO                                     260877
ROBO A TRANSEUNTE EN VÍA PÚBLICA CON Y SIN VIOLENCIA        12941
ROBO DE VEHÍCULO CON Y SIN VIOLENCIA                         8138
HECHO NO DELICTIVO                                           5211
VIOLACIÓN                                                    3403
ROBO A NEGOCIO CON VIOLENCIA                                 2665
ROBO A PASAJERO A BORDO DEL METRO CON Y SIN VIOLENCIA        1691
ROBO A REPARTIDOR CON Y SIN VIOLENCIA                        1680
ROBO A PASAJERO A BORDO DE MICROBUS CON Y SIN VIOLENCIA      1267
HOMICIDIO DOLOSO                                             1054
LESIONES DOLOSAS POR DISPARO DE ARMA DE FUEGO                1018
ROBO A CASA HABITACIÓN CON VIOLENCIA                          374
ROBO A CUENTAHABIENTE SALIENDO DEL CAJERO CON VIOLENCIA       356
ROBO A PASAJERO A BORDO DE TAXI CON VIOLENCIA                 283
ROBO A TRANSPORTISTA CON Y SIN VIOLENCIA                       61
SECUESTRO 

In [228]:
#re= df2223.loc[:, ["Año_delito", "hora_hechos", "Delito", "Fiscalia", "categoria_delito", "alcaldia_hechos", "municipio_hechos", "colonia"]]
#re