# Análisis Exploratorio de Datos de Crímen en CDMX

## Juan Rocamora https://www.linkedin.com/in/juanrocamora/
## 8-Sep-2021

#### Cargamos las librerías y configuración preliminar

In [1]:
import pandas as pd
pd.options.mode.chained_assignment = None  # default='warn'
import seaborn as sns
sns.set(style='darkgrid')
sns.set(context='notebook') 

#### Tomamos los datos de víctimas de carpetas de investigación  de la FGJ para la Ciudad de México (https://datos.cdmx.gob.mx/dataset/victimas-en-carpetas-de-investigacion-fgj). El archivo de datos se encuentra en el repositorio de este proyecto. Cargamos el archivo comprimido.

In [2]:
filename_mexico = 'victimas_completa_julio_2021.csv.bz2'
df = pd.read_csv(filename_mexico, low_memory=False)
df

Unnamed: 0,idCarpeta,Año_inicio,Mes_inicio,FechaInicio,Delito,Categoria,Sexo,Edad,TipoPersona,CalidadJuridica,...,Mes_hecho,FechaHecho,HoraHecho,HoraInicio,AlcaldiaHechos,ColoniaHechos,Calle_hechos,Calle_hechos2,latitud,longitud
0,8324429,2019,Enero,04/01/2019,FRAUDE,DELITO DE BAJO IMPACTO,Masculino,62.0,FISICA,OFENDIDO,...,Agosto,29/08/2018,12:00:00,12:19:00,ALVARO OBREGON,GUADALUPE INN,INSUGENTES SUR,,19.361250,-99.183140
1,8324430,2019,Enero,04/01/2019,"PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCI...",DELITO DE BAJO IMPACTO,Femenino,38.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,15/12/2018,15:00:00,12:20:00,AZCAPOTZALCO,VICTORIA DE LAS DEMOCRACIAS,AV. CUATLAHUAC,,19.471810,-99.164580
2,8324431,2019,Enero,04/01/2019,ROBO A TRANSEUNTE SALIENDO DEL BANCO CON VIOLE...,ROBO A CUENTAHABIENTE SALIENDO DEL CAJERO CON ...,Masculino,42.0,FISICA,VICTIMA Y DENUNCIANTE,...,Diciembre,22/12/2018,15:30:00,12:23:00,COYOACAN,COPILCO UNIVERSIDAD ISSSTE,COPILCO,,19.337970,-99.186110
3,8324435,2019,Enero,04/01/2019,ROBO DE VEHICULO DE SERVICIO PARTICULAR SIN VI...,ROBO DE VEHÍCULO CON Y SIN VIOLENCIA,Masculino,35.0,FISICA,VICTIMA Y DENUNCIANTE,...,Enero,04/01/2019,06:00:00,12:27:00,IZTACALCO,AGRÍCOLA PANTITLAN,CALLE 6,ENTRE PRIVADA DEL VALLE Y PRIVADA GONZALEZ,19.403270,-99.059830
4,8324438,2019,Enero,04/01/2019,ROBO DE MOTOCICLETA SIN VIOLENCIA,ROBO DE VEHÍCULO CON Y SIN VIOLENCIA,Masculino,,FISICA,VICTIMA,...,Enero,03/01/2019,20:00:00,12:35:00,IZTAPALAPA,PROGRESISTA,UNIVERSIDAD,,19.354800,-99.063240
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
619180,8985184,2021,Julio,31/07/2021,ROBO A NEGOCIO CON VIOLENCIA,ROBO A NEGOCIO CON VIOLENCIA,,,MORAL,OFENDIDO,...,Julio,30/07/2021,18:22:00,22:57:00,IZTAPALAPA,CONSEJO AGRARISTA MEXICANO,PALMILLA,PINO,19.320918,-99.056355
619181,8985185,2021,Julio,31/07/2021,LESIONES CULPOSAS,DELITO DE BAJO IMPACTO,Femenino,,FISICA,VICTIMA,...,Julio,30/07/2021,15:40:00,22:57:00,CUAUHTEMOC,,NOTIFICACION DEL HOSPITAL NACIONAL HOMEOPÁTICO,,,
619182,8985186,2021,Julio,31/07/2021,DAÑO EN PROPIEDAD AJENA INTENCIONAL A BIENES I...,DELITO DE BAJO IMPACTO,,,MORAL,OFENDIDO,...,Julio,31/07/2021,14:00:00,23:01:00,GUSTAVO A MADERO,NUEVA ATZACOALCO,AVENIDA INGENIERO EDUARDO MOLINA,AVENIDA 314,19.501652,-99.087726
619183,8985187,2021,Julio,31/07/2021,"ALLANAMIENTO DE MORADA, DESPACHO, OFICINA O ES...",DELITO DE BAJO IMPACTO,Femenino,,FISICA,VICTIMA Y DENUNCIANTE,...,Mayo,26/05/2021,12:00:00,23:04:00,ALVARO OBREGON,AMPLIACIÓN TEPEACA,CURUCU NUM 17,,19.361710,-99.233410


In [3]:
df.columns

Index(['idCarpeta', 'Año_inicio', 'Mes_inicio', 'FechaInicio', 'Delito',
       'Categoria', 'Sexo', 'Edad', 'TipoPersona', 'CalidadJuridica',
       'competencia', 'Año_hecho', 'Mes_hecho', 'FechaHecho', 'HoraHecho',
       'HoraInicio', 'AlcaldiaHechos', 'ColoniaHechos', 'Calle_hechos',
       'Calle_hechos2', 'latitud', 'longitud'],
      dtype='object')

In [4]:
list(df['Delito'].values)

['FRAUDE',
 'PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCIÓN, ALTERACIÓN O FALSIFICACIÓN DE TÍTULOS AL PORTADOR, DOCUMENTOS DE CRÉDITO PÚBLICOS O VALES DE CANJE',
 'ROBO A TRANSEUNTE SALIENDO DEL BANCO CON VIOLENCIA',
 'ROBO DE VEHICULO DE SERVICIO PARTICULAR SIN VIOLENCIA',
 'ROBO DE MOTOCICLETA SIN VIOLENCIA',
 'PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCIÓN, ALTERACIÓN O FALSIFICACIÓN DE TÍTULOS AL PORTADOR, DOCUMENTOS DE CRÉDITO PÚBLICOS O VALES DE CANJE',
 'ROBO A TRANSEUNTE DE CELULAR SIN VIOLENCIA',
 'VIOLACION',
 'PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCIÓN, ALTERACIÓN O FALSIFICACIÓN DE TÍTULOS AL PORTADOR, DOCUMENTOS DE CRÉDITO PÚBLICOS O VALES DE CANJE',
 'OMISION DE AUXILIO O DE CUIDADO',
 'DESPOJO',
 'ROBO A PASAJERO A BORDO DE PESERO COLECTIVO CON VIOLENCIA',
 'PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCIÓN, ALTERACIÓN O FALSIFICACIÓN DE TÍTULOS AL PORTADOR, DOCUMENTOS DE CRÉDITO PÚBLICOS O VALES DE CANJE',
 'PRODUCCIÓN, IMPRESIÓN, ENAJENACIÓN, DISTRIBUCIÓN, ALT

#### Empezamos por ignorar los registros con magnitudes 'no calculables'

In [5]:
df.iloc[2000]

idCarpeta                               8330594
Año_inicio                                 2019
Mes_inicio                                Enero
FechaInicio                          12/01/2019
Delito             ROBO A NEGOCIO CON VIOLENCIA
Categoria          ROBO A NEGOCIO CON VIOLENCIA
Sexo                                        NaN
Edad                                        NaN
TipoPersona                               MORAL
CalidadJuridica                        OFENDIDO
competencia                         FUERO COMUN
Año_hecho                                  2018
Mes_hecho                             Noviembre
FechaHecho                           23/11/2018
HoraHecho                              21:00:00
HoraInicio                             15:38:00
AlcaldiaHechos                          TLAHUAC
ColoniaHechos                   BARRIO SANTIAGO
Calle_hechos                         EJE 10 SUR
Calle_hechos2                               NaN
latitud                                 

In [6]:
df = df.dropna()
latitude = df['latitud'].to_list()
longitude = df['longitud'].to_list()
latitude = latitude[0:2000]
longitude = longitude[0:2000]

In [7]:
import matplotlib.pyplot as plt
import mplleaflet

# longitude = [-99.17756,-99.17256]
# latitude = [19.44290, 19.44690]

plt.plot(longitude, latitude, 'rx') # Draw red squares

mplleaflet.display() 


