# Análisis exploratorio de incidencia delictiva en México

## Descarga los datos
Los datos están limpios y listos para descargar [en esta liga](https://drive.google.com/file/d/1yjeD7lH_rhs86xn0XI0fTQtc-9TYNvnA/view?usp=sharing)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [None]:
df = pd.read_csv('data/delitos.csv')

In [None]:
df.head()

In [None]:
df.tipo_de_delito.unique()

#### Ejercicio 1: Elige 3 estados de la república y grafica una serie de tiempo de la frecuencia abosluta de homicidios dolosos de enero 2015 a julio 2019 en estas tres entidades

In [None]:
#Oaxaca, CDMX, Puebla
df_geo = pd.DataFrame({
    'clave_ent': df.clave_ent.unique(),
    'entidad': df.entidad.unique()
})
df_geo.head()

In [None]:
#entidades seleccionadoas
df_geo[(df_geo.entidad == 'Oaxaca') | (df_geo.entidad == 'Puebla') | (df_geo.entidad == 'Ciudad de México')]

In [None]:
homicidios = df[df.tipo_de_delito == 'Homicidio']
homicidios.head()

In [None]:
homicidios = homicidios[(homicidios.clave_ent == 9) | (homicidios.clave_ent == 20) | (homicidios.clave_ent == 21)]
homicidios.head()

In [None]:
hom_cdmx = homicidios[homicidios.clave_ent == 9]
hom_oax = homicidios[homicidios.clave_ent == 20]
hom_pue = homicidios[homicidios.clave_ent == 21]

In [None]:
hom_cdmx.tail()

In [None]:
plt.figure(figsize=(14,7))
plt.plot(range(len(hom_cdmx.fecha)), hom_cdmx.frecuencia,'b-' ,label="CDMX" )
plt.plot(range(len(hom_oax.fecha)), hom_oax.frecuencia,'r-' ,label="Oaxaca" )
plt.plot(range(len(hom_pue.fecha)), hom_pue.frecuencia,'g-' ,label="Puebla" )
plt.xticks(range(len(hom_cdmx.fecha)), hom_cdmx.fecha, rotation=90)
plt.legend(loc='best')
plt.show()

#### Ejercicio 2: Contetas las siguientes  preguntas:
1. ¿Cuántos homicidios dolosos hubo en Colima en el 2018?
2. ¿Cuantos robos de vehículo automotor ha habido en el 2019?
3. Obten la suma de homicidos dolosos y feminidios en toda la República Mexicana en cada año.
4. ¿En qué mes y en qué municipio ha ocurrido el mayor número de feminicidios?
5. ¿En qué año y en qué estado ha ocurrido el mayor número de feminicidios?

#### Ejercicio 3: Haz una gráfica de pastel de tipos de delito. Deberás crear una gráfica para cada año. Utilzia la función subplots de matplotlib

In [None]:
df['anio'] = df.fecha.apply(lambda x: int(x.split('-')[0]))
df3 = df.groupby(['anio', 'tipo_de_delito']).agg({'frecuencia':'sum'}).reset_index()
plt.figure(figsize=(14,14))
plt.pie(df3[df3.anio == 2015].frecuencia, labels=df3[df3.anio == 2015].tipo_de_delito)
plt.tight_layout()
plt.show()

---
## Tasa por 100,000 habitantes
Mostrar el total de delitos en una entidad no nos sirve de mucho. Es mucho más útil calcular la tasa de incidencia delictiva por cada 100,000 habitantes

$$
tasa = \frac{delitos\space totales}{población} \times 100,000
$$

Esta tasa la podemos anualizar multiplicándola por un factor de 12
$$
tasa\space anualizada = tasa \times 12
$$

### Población por entidad federativa según [la encuesta intercensal 2015](https://www.inegi.org.mx/programas/intercensal/2015/)

---

In [None]:
pobs = pd.read_csv('data/poblacion_entidades_2015.csv', encoding='iso-8859-1', sep=";")
pobs = pobs[['Cve_Entidad', 'Entidad', 'Poblacion']]
pobs = pobs.rename(columns={'Cve_Entidad':'clave_entidad', 'Entidad':'entidad', 'Poblacion':'poblacion'})
pobs.head()

In [None]:
# Create a new dataframe that shows the crime rate per 100,000 inhabitants
# Group all the crimes by state and year
df4 = df.groupby(['entidad','clave_ent', 'anio']).agg({'frecuencia':'sum'}).reset_index()
df4 = df4.merge(pobs, left_on='clave_ent', right_on='clave_entidad')
df4['tasa'] = df4.frecuencia / df4.poblacion * 100000

In [None]:
# Plot the crime rate per 100,000 inhabitants per state. Line across time
plt.figure(figsize=(14,14))
for i in df4.entidad_x.unique():
    plt.plot(df4[df4.entidad_x == i].anio, df4[df4.entidad_x == i].tasa, label=i)
plt.legend(loc='best')
plt.show()
