## Módulo 1: Análisis de datos en el accidentes Python


##### Análisis de accidentes de tráfica de la ciudad de Madrid

##### Accidentes de tráfico en la Ciudad de Madrid registrados por la Policía Municipal. 
Gracias a la **web de [Datos Abiertos del Ayuntamiento de Madrid](https://datos.madrid.es/portal/site/egob/menuitem.400a817358ce98c34e937436a8a409a0/?vgnextoid=eba412b9ace9f310VgnVCM100000171f5a0aRCRD&vgnextchannel=eba412b9ace9f310VgnVCM100000171f5a0aRCRD&vgnextfmt=default)** . Los datos de accidentes se incluye **un registro por persona implicada en el accidente en el año 2019 y posteriores.**




In [59]:
# importamos las librerías necesarias 
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

In [60]:
# Modificamos los parámetros de los gráficos en matplotlib
from matplotlib.pyplot import rcParams

rcParams['figure.figsize'] = 12, 6 # el primer dígito es el ancho y el segundo el alto
rcParams["font.weight"] = "bold"
rcParams["font.size"] = 10
rcParams["axes.labelweight"] = "bold"

### Cargar los datospara el modelo

In [61]:
# Cargar el dataset desde un archivo
df_accidentes = pd.read_csv('../data/2023-2019_Accidentalidad.csv',delimiter=';',on_bad_lines='skip')

In [62]:
# Consultar los resgistro de DataFrame
df_accidentes

Unnamed: 0,num_expediente,fecha,hora,localizacion,numero,cod_distrito,distrito,tipo_accidente,estado_meteorológico,tipo_vehiculo,tipo_persona,rango_edad,sexo,cod_lesividad,lesividad,coordenada_x_utm,coordenada_y_utm,positiva_alcohol,positiva_droga
0,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Conductor,De 55 a 59 años,Mujer,14.0,Sin asistencia sanitaria,443397166,4478129388,N,
1,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Hombre,14.0,Sin asistencia sanitaria,443397166,4478129388,N,
2,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Hombre,14.0,Sin asistencia sanitaria,443397166,4478129388,N,
3,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Mujer,7.0,Asistencia sanitaria sólo en el lugar del acci...,443397166,4478129388,N,
4,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 55 a 59 años,Hombre,7.0,Asistencia sanitaria sólo en el lugar del acci...,443397166,4478129388,N,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
138210,2019S039993,10/11/2019,11:00:00,PLAZA. ELIPTICA / CALL. MARCELO USERA,1,12.0,USERA,Colisión lateral,Despejado,Turismo,Pasajero,De 60 a 64 años,Mujer,14.0,Sin asistencia sanitaria,439115482,4470746354,N,
138211,2019S040001,13/03/2019,12:47:00,"CALL. ALFONSO FERNANDEZ CLAUSELLS, 7",7,9.0,MONCLOA-ARAVACA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,Desconocido,Desconocido,,,438541541,4479292853,N,
138212,2019S040001,13/03/2019,12:47:00,"CALL. ALFONSO FERNANDEZ CLAUSELLS, 7",7,9.0,MONCLOA-ARAVACA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,Más de 74 años,Mujer,,,438541541,4479292853,N,
138213,2019S040007,03/11/2019,10:10:00,"CALL. HALCONERO DEL REY, 0",0,11.0,CARABANCHEL,Colisión fronto-lateral,Despejado,Turismo,Conductor,De 25 a 29 años,Mujer,,,438343989,4468673466,N,


In [63]:
# Contar datos perdidio/fantantes
df_accidentes.isna().sum()

num_expediente               0
fecha                        0
hora                         0
localizacion                 0
numero                       6
cod_distrito                 6
distrito                     6
tipo_accidente               4
estado_meteorológico     14169
tipo_vehiculo              464
tipo_persona                 3
rango_edad                   0
sexo                         0
cod_lesividad            61455
lesividad                61455
coordenada_x_utm             4
coordenada_y_utm             4
positiva_alcohol           430
positiva_droga          137832
dtype: int64

In [68]:
# La información útil sobre los datos guardados en formato dataFrame
df_accidentes.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 138215 entries, 0 to 138214
Data columns (total 19 columns):
 #   Column                Non-Null Count   Dtype  
---  ------                --------------   -----  
 0   num_expediente        138215 non-null  object 
 1   fecha                 138215 non-null  object 
 2   hora                  138215 non-null  object 
 3   localizacion          138215 non-null  object 
 4   numero                138209 non-null  object 
 5   cod_distrito          138209 non-null  float64
 6   distrito              138209 non-null  object 
 7   tipo_accidente        138211 non-null  object 
 8   estado_meteorológico  124046 non-null  object 
 9   tipo_vehiculo         137751 non-null  object 
 10  tipo_persona          138212 non-null  object 
 11  rango_edad            138215 non-null  object 
 12  sexo                  138215 non-null  object 
 13  cod_lesividad         76760 non-null   float64
 14  lesividad             76760 non-null   object 
 15  

Unnamed: 0,num_expediente,fecha,hora,localizacion,numero,cod_distrito,distrito,tipo_accidente,estado_meteorológico,tipo_vehiculo,tipo_persona,rango_edad,sexo,cod_lesividad,lesividad,coordenada_x_utm,coordenada_y_utm,positiva_alcohol,positiva_droga
6900,2023S005967,21/02/2023,21:40:00,"PLAZA. LAVAPIES, 6",6,1.0,CENTRO,Colisión lateral,Despejado,Turismo,Conductor,De 25 a 29 años,Hombre,,,440524964,4473346237,N,
6901,2023S005967,21/02/2023,21:40:00,"PLAZA. LAVAPIES, 6",6,1.0,CENTRO,Colisión lateral,Despejado,Turismo,Conductor,De 30 a 34 años,Hombre,,,440524964,4473346237,N,
6902,2023S005968,21/02/2023,22:50:00,"CALL. JACOBEO, 34",34,10.0,LATINA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,De 25 a 29 años,Hombre,,,435277889,446884635,N,
6903,2023S005968,21/02/2023,22:50:00,"CALL. JACOBEO, 34",34,10.0,LATINA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,De 35 a 39 años,Mujer,,,435277889,446884635,S,
6904,2023S005969,22/02/2023,0:05:00,CALL. ALHAMBRA / FRANCISCA ARMADA,14,10.0,LATINA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,De 45 a 49 años,Hombre,,,436846114,4472838936,S,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6995,2023S006021,22/02/2023,17:28:00,CALL. SIMCA / CALL. TALBOT,4,12.0,USERA,Colisión fronto-lateral,,Turismo,Conductor,De 21 a 24 años,Hombre,,,439638758,4468676067,N,
6996,2023S006021,22/02/2023,17:28:00,CALL. SIMCA / CALL. TALBOT,4,12.0,USERA,Colisión fronto-lateral,,Turismo,Conductor,Desconocido,Desconocido,,,439638758,4468676067,N,
6997,2023S006031,22/02/2023,16:45:00,AVDA. NICETO ALCALA ZAMORA / AVDA. FRANCISCO P...,5,16.0,HORTALEZA,Caída,Despejado,Motocicleta hasta 125cc,Conductor,De 30 a 34 años,Hombre,7.0,Asistencia sanitaria sólo en el lugar del acci...,445206038,4481881099,N,
6998,2023S006045,22/02/2023,17:51:00,"CALL. MENDEZ ALVARO, 6",6,2.0,ARGANZUELA,Colisión frontal,,Turismo,Conductor,De 35 a 39 años,Hombre,,,441236957,4473146486,N,


In [66]:
# Consultar los datos perdido/nulo
df_accidentes['estado_meteorológico'].isna()

0         False
1         False
2         False
3         False
4         False
          ...  
138210    False
138211    False
138212    False
138213    False
138214    False
Name: estado_meteorológico, Length: 138215, dtype: bool

In [67]:
#Contar los valores nulos para este campo

df_accidentes['positiva_droga'].isna().sum()

137832

In [None]:
#Mostrar los valores nulos de este campo
df_accidentes['positiva_droga'][df_accidentes['positiva_droga'].isna()]

0        NaN
1        NaN
2        NaN
3        NaN
4        NaN
          ..
185263   NaN
185264   NaN
185265   NaN
185266   NaN
185267   NaN
Name: positiva_droga, Length: 184745, dtype: float64

In [69]:
df_accidentes['positiva_droga']= df_accidentes['positiva_droga'].fillna(0)

In [70]:
df_accidentes

Unnamed: 0,num_expediente,fecha,hora,localizacion,numero,cod_distrito,distrito,tipo_accidente,estado_meteorológico,tipo_vehiculo,tipo_persona,rango_edad,sexo,cod_lesividad,lesividad,coordenada_x_utm,coordenada_y_utm,positiva_alcohol,positiva_droga
0,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Conductor,De 55 a 59 años,Mujer,14.0,Sin asistencia sanitaria,443397166,4478129388,N,0.0
1,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Hombre,14.0,Sin asistencia sanitaria,443397166,4478129388,N,0.0
2,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Hombre,14.0,Sin asistencia sanitaria,443397166,4478129388,N,0.0
3,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 21 a 24 años,Mujer,7.0,Asistencia sanitaria sólo en el lugar del acci...,443397166,4478129388,N,0.0
4,2023S000001,01/01/2023,1:15:00,"AVDA. ALFONSO XIII, 33",33,5.0,CHAMARTÍN,Alcance,Despejado,Todo terreno,Pasajero,De 55 a 59 años,Hombre,7.0,Asistencia sanitaria sólo en el lugar del acci...,443397166,4478129388,N,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
138210,2019S039993,10/11/2019,11:00:00,PLAZA. ELIPTICA / CALL. MARCELO USERA,1,12.0,USERA,Colisión lateral,Despejado,Turismo,Pasajero,De 60 a 64 años,Mujer,14.0,Sin asistencia sanitaria,439115482,4470746354,N,0.0
138211,2019S040001,13/03/2019,12:47:00,"CALL. ALFONSO FERNANDEZ CLAUSELLS, 7",7,9.0,MONCLOA-ARAVACA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,Desconocido,Desconocido,,,438541541,4479292853,N,0.0
138212,2019S040001,13/03/2019,12:47:00,"CALL. ALFONSO FERNANDEZ CLAUSELLS, 7",7,9.0,MONCLOA-ARAVACA,Choque contra obstáculo fijo,Despejado,Turismo,Conductor,Más de 74 años,Mujer,,,438541541,4479292853,N,0.0
138213,2019S040007,03/11/2019,10:10:00,"CALL. HALCONERO DEL REY, 0",0,11.0,CARABANCHEL,Colisión fronto-lateral,Despejado,Turismo,Conductor,De 25 a 29 años,Mujer,,,438343989,4468673466,N,0.0
