# Top 3 delitos por estado

In [1]:
# Manejar rutas
from pathlib import Path

# Cargar y transformar datos
import pandas as pd
import numpy as np

# Visualización
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [2]:
data_path = Path('./data')
tidy_path = data_path / 'tidy'

In [3]:
semaforo = pd.read_csv(tidy_path / 'delitos_semaforo.csv', encoding = 'iso-8859-1')

In [45]:
semaforo_p = pd.read_parquet(tidy_path / 'delitos_semaforo.parquet')

In [47]:
semaforo.shape, semaforo_p.shape

((656611, 21), (656611, 23))

In [46]:
semaforo_p.head()

Unnamed: 0,anio,clave_ent,entidad,clave_municipio,municipio,bien_afectado,tipo_delito,subtipo_delito,delito_semaforo,modalidad,...,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
0,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma de fuego,...,1,0,1,1,0,2,1,0,1,10
1,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma blanca,...,0,0,1,0,1,0,0,0,0,4
2,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con otro elemento,...,1,3,2,0,1,2,0,0,0,10
3,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,No especificado,...,1,0,0,0,0,0,0,0,0,2
4,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Lesiones,Lesiones dolosas,Lesiones,Con arma de fuego,...,1,1,1,3,2,1,3,2,2,23


In [4]:
semaforo.head()

Unnamed: 0,anio,clave_ent,entidad,clave_municipio,municipio,bien_afectado,tipo_delito,subtipo_delito,delito_semaforo,modalidad,...,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
0,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma de fuego,...,1,0,1,1,0,2,1,0,1,9
1,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma blanca,...,0,0,1,0,1,0,0,0,0,3
2,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con otro elemento,...,1,3,2,0,1,2,0,0,0,9
3,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,No especificado,...,1,0,0,0,0,0,0,0,0,2
4,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Lesiones,Lesiones dolosas,Lesiones,Con arma de fuego,...,1,1,1,3,2,1,3,2,2,17


In [5]:
print(f"{semaforo.shape[0]:,} filas y {semaforo.shape[1]} columnas")

656,611 filas y 21 columnas


In [6]:
top3 = semaforo[semaforo['anio']==2022].groupby(['entidad', 'delito_semaforo']).count()[['total']]
top3

Unnamed: 0_level_0,Unnamed: 1_level_0,total
entidad,delito_semaforo,Unnamed: 2_level_1
Aguascalientes,Extorsión,11
Aguascalientes,Feminicidio,44
Aguascalientes,Homicidios,44
Aguascalientes,Lesiones,44
Aguascalientes,Narcomenudeo,11
...,...,...
Zacatecas,Robo a negocio,116
Zacatecas,Robo a vehículo,348
Zacatecas,Secuestros,290
Zacatecas,Violación,58


In [7]:
# Agrupar por entidad y sumar el total de ocurrencias de cada delito
delitos_ocurrencias = semaforo.groupby('entidad')['total'].sum()

# Obtener los 3 delitos con más ocurrencias por entidad
delitos_top3_por_entidad = delitos_ocurrencias.groupby(level=0).nlargest(3)

# Imprimir los resultados
print(delitos_top3_por_entidad)

entidad                          entidad                        
Aguascalientes                   Aguascalientes                      99809
Baja California                  Baja California                    397365
Baja California Sur              Baja California Sur                 60057
Campeche                         Campeche                            20204
Chiapas                          Chiapas                             71979
Chihuahua                        Chihuahua                          248022
Ciudad de México                 Ciudad de México                   505853
Coahuila de Zaragoza             Coahuila de Zaragoza               184562
Colima                           Colima                              71561
Durango                          Durango                            102235
Guanajuato                       Guanajuato                         386757
Guerrero                         Guerrero                            92275
Hidalgo                          Hi

In [8]:
# Agrupar por entidad y sumar el total de ocurrencias de cada delito
delitos_ocurrencias = semaforo.groupby(['anio', 'entidad', 'delito_semaforo'])['total'].sum()

# Obtener los 3 delitos con más ocurrencias por entidad
delitos_top3_por_entidad = delitos_ocurrencias.groupby(level=0).nlargest(3)

# Imprimir los resultados
print(delitos_top3_por_entidad)

anio  anio  entidad           delito_semaforo   
2015  2015  México            Robo a vehículo       39700
                              Lesiones              28343
                              Robo a negocio        15755
2016  2016  México            Robo a vehículo       34059
                              Lesiones              27643
            Ciudad de México  Violencia familiar    15373
2017  2017  México            Robo a vehículo       40744
                              Lesiones              34272
            Jalisco           Robo a vehículo       20160
2018  2018  México            Robo a vehículo       45738
                              Lesiones              37483
            Jalisco           Robo a vehículo       19798
2019  2019  México            Lesiones              40973
                              Robo a vehículo       39363
            Ciudad de México  Violencia familiar    21816
2020  2020  México            Lesiones              35373
                       

In [9]:
# Filtrar por año
anio_deseado = 2022  # Cambia este valor al año que desees filtrar
data_filtrado = semaforo[semaforo['anio'] == anio_deseado]

# Agrupar por entidad, delito_semaforo y sumar el total de ocurrencias de cada delito
delitos_ocurrencias = data_filtrado.groupby(['entidad', 'delito_semaforo'])['total'].sum().reset_index()

# Obtener los 3 delitos con más ocurrencias por entidad
delitos_top3_por_entidad = delitos_ocurrencias.groupby('entidad').apply(lambda x: x.nlargest(3, 'total')).reset_index(drop=True)

# Crear el gráfico de barras
fig = px.bar(delitos_top3_por_entidad, x='entidad', y='total', color='delito_semaforo', barmode='group')

# Mostrar el gráfico
fig.show()

interpretación: la violencia familiar esta salida de control
lesiones también, pero que son lesiones? un balazo, una pelea?

In [10]:
delitos_top3_por_entidad

Unnamed: 0,entidad,delito_semaforo,total
0,Aguascalientes,Lesiones,3051
1,Aguascalientes,Violencia familiar,2145
2,Aguascalientes,Robo a casa,1775
3,Baja California,Violencia familiar,11350
4,Baja California,Robo a vehículo,10260
...,...,...,...
91,Yucatán,Lesiones,170
92,Yucatán,Robo a casa,134
93,Zacatecas,Violencia familiar,2901
94,Zacatecas,Robo a vehículo,1556


In [11]:
delitos_top3_por_entidad['entidad'].unique()

array(['Aguascalientes', 'Baja California', 'Baja California Sur',
       'Campeche', 'Chiapas', 'Chihuahua', 'Ciudad de México',
       'Coahuila de Zaragoza', 'Colima', 'Durango', 'Guanajuato',
       'Guerrero', 'Hidalgo', 'Jalisco', 'Michoacán de Ocampo', 'Morelos',
       'México', 'Nayarit', 'Nuevo León', 'Oaxaca', 'Puebla', 'Querétaro',
       'Quintana Roo', 'San Luis Potosí', 'Sinaloa', 'Sonora', 'Tabasco',
       'Tamaulipas', 'Tlaxcala', 'Veracruz de Ignacio de la Llave',
       'Yucatán', 'Zacatecas'], dtype=object)

In [12]:
delitos_top3_por_entidad['entidad'].nunique()

32

# Que raro que sean las mismas cantidades

In [13]:
semaforo['modalidad'].value_counts()

modalidad
Con arma de fuego                                         63543
Con arma blanca                                           63543
Con otro elemento                                         63543
No especificado                                           63543
Sin violencia                                             42362
Con violencia                                             42362
Secuestro para causar daño                                21181
Secuestro exprés                                          21181
Otro tipo de secuestros                                   21181
Violación simple                                          21181
Secuestro con calidad de rehén                            21181
Secuestro extorsivo                                       21181
Robo de coche de 4 ruedas Con violencia                   21181
Robo de coche de 4 ruedas Sin violencia                   21181
Robo de motocicleta Con violencia                         21181
Robo de motocicleta Sin violen

In [15]:
semaforos = {
    anio : semaforo[semaforo['anio'] == anio]
    for anio in range(2015, 2023)
    
}

In [16]:
semaforos[2015]

Unnamed: 0,anio,clave_ent,entidad,clave_municipio,municipio,bien_afectado,tipo_delito,subtipo_delito,delito_semaforo,modalidad,...,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
0,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma de fuego,...,1,0,1,1,0,2,1,0,1,9
1,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con arma blanca,...,0,0,1,0,1,0,0,0,0,3
2,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,Con otro elemento,...,1,3,2,0,1,2,0,0,0,9
3,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Homicidio,Homicidio doloso,Homicidios,No especificado,...,1,0,0,0,0,0,0,0,0,2
4,2015,1,Aguascalientes,1001,Aguascalientes,La vida y la Integridad corporal,Lesiones,Lesiones dolosas,Lesiones,Con arma de fuego,...,1,1,1,3,2,1,3,2,2,17
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
59856,2015,32,Zacatecas,32058,Santa María de la Paz,El patrimonio,Robo,Robo a negocio,Robo a negocio,Con violencia,...,0,0,0,0,0,0,0,0,0,0
59857,2015,32,Zacatecas,32058,Santa María de la Paz,El patrimonio,Robo,Robo a negocio,Robo a negocio,Sin violencia,...,0,0,0,0,0,0,0,0,0,0
59858,2015,32,Zacatecas,32058,Santa María de la Paz,El patrimonio,Extorsión,Extorsión,Extorsión,Extorsión,...,0,0,0,0,0,0,0,0,0,0
59859,2015,32,Zacatecas,32058,Santa María de la Paz,La familia,Violencia familiar,Violencia familiar,Violencia familiar,Violencia familiar,...,1,0,0,0,0,0,0,0,1,2


In [17]:
semaforos[2015].groupby(['entidad','delito_semaforo'])['total'].sum().reset_index()

Unnamed: 0,entidad,delito_semaforo,total
0,Aguascalientes,Extorsión,34
1,Aguascalientes,Feminicidio,0
2,Aguascalientes,Homicidios,33
3,Aguascalientes,Lesiones,1890
4,Aguascalientes,Narcomenudeo,521
...,...,...,...
347,Zacatecas,Robo a negocio,242
348,Zacatecas,Robo a vehículo,1840
349,Zacatecas,Secuestros,14
350,Zacatecas,Violación,106


In [18]:
cols_meses = ['enero','abril','mayo','junio','julio','agosto','septiembre','octubre','noviembre', 'diciembre', 'total']

In [19]:
semaforos[2015].groupby(['delito_semaforo', 'entidad'])[cols_meses].sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,enero,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
delito_semaforo,entidad,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
Extorsión,Aguascalientes,2,5,7,2,1,3,2,6,4,2,34
Extorsión,Baja California,7,10,17,16,19,19,27,20,17,26,178
Extorsión,Baja California Sur,3,7,10,5,0,3,4,0,6,4,42
Extorsión,Campeche,2,2,3,3,3,1,4,7,3,6,34
Extorsión,Chiapas,10,23,21,22,20,12,18,25,25,16,192
...,...,...,...,...,...,...,...,...,...,...,...,...
Violencia familiar,Tamaulipas,126,197,241,273,212,235,164,205,216,291,2160
Violencia familiar,Tlaxcala,8,0,0,0,0,1,1,1,0,1,12
Violencia familiar,Veracruz de Ignacio de la Llave,236,461,438,307,148,342,297,380,305,239,3153
Violencia familiar,Yucatán,201,188,206,201,222,175,164,175,167,171,1870


In [20]:
semaforos[2015].groupby(['entidad', 'delito_semaforo'])[cols_meses].sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,enero,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
entidad,delito_semaforo,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
Aguascalientes,Extorsión,2,5,7,2,1,3,2,6,4,2,34
Aguascalientes,Feminicidio,0,0,0,0,0,0,0,0,0,0,0
Aguascalientes,Homicidios,6,4,4,4,2,3,4,2,2,2,33
Aguascalientes,Lesiones,172,227,210,216,201,235,173,169,144,143,1890
Aguascalientes,Narcomenudeo,37,44,53,53,51,81,45,58,45,54,521
...,...,...,...,...,...,...,...,...,...,...,...,...
Zacatecas,Robo a negocio,26,24,21,42,24,26,32,18,21,8,242
Zacatecas,Robo a vehículo,192,139,157,202,198,180,197,200,200,175,1840
Zacatecas,Secuestros,2,3,3,1,1,0,2,1,0,1,14
Zacatecas,Violación,17,12,16,13,6,9,9,9,9,6,106


In [21]:
s = semaforo.groupby(['anio','entidad', 'delito_semaforo'])[cols_meses].sum().reset_index()
s

Unnamed: 0,anio,entidad,delito_semaforo,enero,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
0,2015,Aguascalientes,Extorsión,2,5,7,2,1,3,2,6,4,2,34
1,2015,Aguascalientes,Feminicidio,0,0,0,0,0,0,0,0,0,0,0
2,2015,Aguascalientes,Homicidios,6,4,4,4,2,3,4,2,2,2,33
3,2015,Aguascalientes,Lesiones,172,227,210,216,201,235,173,169,144,143,1890
4,2015,Aguascalientes,Narcomenudeo,37,44,53,53,51,81,45,58,45,54,521
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3163,2023,Zacatecas,Robo a negocio,21,18,25,21,19,32,38,0,0,0,174
3164,2023,Zacatecas,Robo a vehículo,179,164,151,160,156,119,171,0,0,0,1100
3165,2023,Zacatecas,Secuestros,1,0,0,1,1,0,0,0,0,0,3
3166,2023,Zacatecas,Violación,7,15,11,17,12,14,16,0,0,0,92


In [22]:
df_melted = s.melt(
    id_vars=['anio', 'entidad', 'delito_semaforo'],
    value_vars=['enero', 'abril', 'mayo', 'junio', 'julio', 'agosto', 'septiembre', 'octubre', 'noviembre', 'diciembre'],
    var_name='mes',
    value_name='conteo'
)

In [23]:
df_melted

Unnamed: 0,anio,entidad,delito_semaforo,mes,conteo
0,2015,Aguascalientes,Extorsión,enero,2
1,2015,Aguascalientes,Feminicidio,enero,0
2,2015,Aguascalientes,Homicidios,enero,6
3,2015,Aguascalientes,Lesiones,enero,172
4,2015,Aguascalientes,Narcomenudeo,enero,37
...,...,...,...,...,...
31675,2023,Zacatecas,Robo a negocio,diciembre,0
31676,2023,Zacatecas,Robo a vehículo,diciembre,0
31677,2023,Zacatecas,Secuestros,diciembre,0
31678,2023,Zacatecas,Violación,diciembre,0


In [24]:
df_melted.query("delito_semaforo == 'Homicidios' and entidad == 'Aguascalientes' and anio == 2015")

Unnamed: 0,anio,entidad,delito_semaforo,mes,conteo
2,2015,Aguascalientes,Homicidios,enero,6
3170,2015,Aguascalientes,Homicidios,abril,4
6338,2015,Aguascalientes,Homicidios,mayo,4
9506,2015,Aguascalientes,Homicidios,junio,4
12674,2015,Aguascalientes,Homicidios,julio,2
15842,2015,Aguascalientes,Homicidios,agosto,3
19010,2015,Aguascalientes,Homicidios,septiembre,4
22178,2015,Aguascalientes,Homicidios,octubre,2
25346,2015,Aguascalientes,Homicidios,noviembre,2
28514,2015,Aguascalientes,Homicidios,diciembre,2


In [25]:
fig = px.line(df_melted.query("delito_semaforo == 'Homicidios' and entidad == 'Aguascalientes' and anio == 2015"), x="mes", y="conteo", title='Delitos por mes')
fig.show()

In [26]:
fig = px.line(df_melted.query("delito_semaforo == 'Narcomenudeo' and entidad == 'Aguascalientes' and anio == 2015"), x="mes", y="conteo", title='Delitos por mes')
fig.show()

In [31]:
df_melted

Unnamed: 0,anio,entidad,delito_semaforo,mes,conteo
0,2015,Aguascalientes,Extorsión,enero,2
1,2015,Aguascalientes,Feminicidio,enero,0
2,2015,Aguascalientes,Homicidios,enero,6
3,2015,Aguascalientes,Lesiones,enero,172
4,2015,Aguascalientes,Narcomenudeo,enero,37
...,...,...,...,...,...
31675,2023,Zacatecas,Robo a negocio,diciembre,0
31676,2023,Zacatecas,Robo a vehículo,diciembre,0
31677,2023,Zacatecas,Secuestros,diciembre,0
31678,2023,Zacatecas,Violación,diciembre,0


In [35]:
s = df_melted

In [40]:
import ipywidgets as widgets

def graficar(delito, anio, entidad):
    vista = df_melted[df_melted["delito_semaforo"] == delito]
    # vista = vista[vista["anio"] == anio]
    vista = vista[vista["entidad"] == entidad]
    # for anio in range(2015, 2023):
    fig = px.line(vista, x=vista['mes'], y='conteo', color='anio')
    # fig.update_traces(visible='legendonly')
    fig.show()

widgets.interact(graficar, delito=s.delito_semaforo.unique(),
                            anio=s.anio.unique(),
                            entidad=s.entidad.unique(),
)

interactive(children=(Dropdown(description='delito', options=('Extorsión', 'Feminicidio', 'Homicidios', 'Lesio…

<function __main__.graficar(delito, anio, entidad)>

In [42]:
df_melted

Unnamed: 0,anio,entidad,delito_semaforo,mes,conteo
0,2015,Aguascalientes,Extorsión,enero,2
1,2015,Aguascalientes,Feminicidio,enero,0
2,2015,Aguascalientes,Homicidios,enero,6
3,2015,Aguascalientes,Lesiones,enero,172
4,2015,Aguascalientes,Narcomenudeo,enero,37
...,...,...,...,...,...
31675,2023,Zacatecas,Robo a negocio,diciembre,0
31676,2023,Zacatecas,Robo a vehículo,diciembre,0
31677,2023,Zacatecas,Secuestros,diciembre,0
31678,2023,Zacatecas,Violación,diciembre,0


In [43]:
df_melted['mes'].unique()

array(['enero', 'abril', 'mayo', 'junio', 'julio', 'agosto', 'septiembre',
       'octubre', 'noviembre', 'diciembre'], dtype=object)

In [None]:
semaforos[2015].iloc[:3, 10:]

Unnamed: 0,enero,abril,mayo,junio,julio,agosto,septiembre,octubre,noviembre,diciembre,total
0,2,1,0,1,1,0,2,1,0,1,9
1,1,0,0,1,0,1,0,0,0,0,3
2,0,1,3,2,0,1,2,0,0,0,9


In [None]:
semaforos[2015].iloc[:3, 10:].sum(axis=0)

enero          3
abril          2
mayo           3
junio          4
julio          1
agosto         2
septiembre     4
octubre        1
noviembre      0
diciembre      1
total         21
dtype: int64