<h1>TRÁNSITO EN LA CIUDAD DE MÉXICO
    
<h2>Contexto
    <h4>Día a día, ocurren accidentes de tránsito en cualquier parte del país. Sin embargo, estos pueden ser más concurrentes al existir un mayor flujo de personas, especialmente en ciudades tan grandes como es la Ciudad de México (de hecho, es la segunda ciudad más poblada a nivel América), donde día a día el tráfico, el estrés, la premura del tiempo y diversos factores provocan que todas las personas que transitan por las calles de esta enorme ciudad estén en riesgo de sufrir un percance.

Es por ello que se eligió la base de datos llamada Hechos_tránsito, la cual compila todos los accidentes registrados en la Ciudad de México desde Enero de 2018 hasta Octubre de 2022.

La base de datos fue obtenida a través de la siguiente liga: https://datos.cdmx.gob.mx/dataset/hechos-de-transito-reportados-por-ssc-base-ampliada-no-comparativa y corresponde a los Datos Abiertos que pone a disposición tanto el gobierno federal como local de México, el cual utiliza el sistema de repositorios de datos abiertos CKAN (https://datos.gob.mx/blog/ckan?category=api-cdn&tag=educacion)

<h2>Objetivo
    <h4>Analizar cuáles son los accidentes de tránsito más comunes y las principales zonas de riesgo en la Ciudad de México

        
<h2>Audiencia
    <h4>Si bien es cierto que los accidentes no se pueden prevenir, sí es posible mitigar el riesgo a que ocurran. Así, el presente documento se encargará de analizar algunos datos que podrían ser de interés para los conductores y transeúntes, pues al conocer los lugares donde han ocurrido el mayor número de accidentes, podría ser benéfico para tomar mayores precauciones a la hora de conducir o tomar otras medidas preventivas. 
        Sin embargo, también podría ser de interés para los organismos gubernamentales (como la Subsecretaría de Control de Tránsito), ya que a través del análisis de los hechos ocurridos y del tipo de accidentes, esto podría ser de gran ayuda para  analizar las medidas actuales que se están tomando para prevenir percances automovilísticos, verificar si están funcionando o no, revisar y/o actualizar tanto el reglamento de tránsito como su cumplimiento, y qué otras acciones se podrían tomar, como pudieran ser:
        
<ul>
      <li>Desarrollo y/o actualización de programas y planes que realmente hagan más seguro el tránsito en la metrópoli</li>
      <li>Instalación de nuevos semáforos y verificación del funcionamiento de los semáforos actuales</li>
      <li>Mayor número de elementos de seguridad en los puntos y horas con más accidentes</li>
      <li>Hacer que el reglamento de tránsito sea respetado sin excepciones</li>
      <li>Realizar campañas informativas acerca de los derechos y obligaciones de los automovilistas, motociclistas, ciclistas y transeúntes</li>
    
<h2>Preguntas de interés

<h4>Algunas de las preguntas que puede resultar interesante responder son:
<ol>
    <li>¿Cuáles son los hechos de tránsito más comunes en la CDMX?</li>
    <li>¿Qué tipo de vehículo fue el más involucrado? (motocicleta, automóvil, transporte público, etc)
    <li>¿En qué Alcaldías hubo más accidentes registrados?</li>
    <li>¿Hay alguna hora del día donde ocurran más percanes?</li>
    <li>¿En qué meses del año hay más hechos de tránsito?</li>
    

# Código

In [3]:
#Importar librerías más usadas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

ModuleNotFoundError: No module named 'pandas'

In [None]:
df = pd.read_csv("hechos_transito.csv", sep=",", low_memory=False)

In [None]:
#Verificamos si se importó el archivo
display(df)

Unnamed: 0,no_folio,fecha_evento,mes,hora,condicion,tipo_de_evento,coordenada_x,coordenada_y,punto_1,punto_2,...,pasajero_lesionado,motociclista_occiso,motociclista_lesionado,conductor_occiso,conductor_lesionado,diagnostico_occiso,diagnostico_lesionado,origen,rango_de_edades_menores_de_1_ano_occiso,matricula_unidad_medica
0,BJ/200406/03499,06/04/2020,abril,12:50:00,,CHOQUE,19.368116,-99.142903,EJE 7 SUR,ANTILLAS,...,0.0,0.0,0.0,0.0,0.0,,POLICONTUNDIDO,RADIO,,
1,C5/200406/05748,06/04/2020,abril,18:31:00,,CHOQUE,19.301142,-99.115521,CALZ DEL HUESO,RANCHO COLORADO,...,0.0,0.0,1.0,0.0,0.0,,POLICONTUNDIDO,911 CDMX,,
2,C5/200406/05802,06/04/2020,abril,18:39:00,,CHOQUE,19.476843,-99.092207,EJE 5 NTE,AV GRAN CANAL DEL DESAGUE,...,0.0,0.0,1.0,0.0,0.0,,HX BOCA,911 CDMX,,
3,IZ/200406/03058,06/04/2020,abril,11:38:00,,DERRAPADO,19.298474,-98.984670,EJE 10 SUR,AV SAN FCO,...,0.0,0.0,1.0,0.0,0.0,,POLICONTUNDIDO,RADIO,,
4,C5/200406/03762,06/04/2020,abril,13:31:00,,DERRAPADO,19.436170,-99.204754,AV HOMERO,SOFOCLES,...,0.0,0.0,1.0,0.0,0.0,,CX RODILLA IZQ,911 CDMX,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
100009,C5/20221031/04295,31/10/2022,octubre,21:01:00,,DERRAPADO,19.388080,-99.075308,EJE 3 SUR,EJE 5 OTE,...,0.0,0.0,1.0,0.0,0.0,,A DESCARTAR FX TERCIO DISTAL EN TIBIA Y PERONE...,LLAMADA DEL 911,0.0,
100010,C5/20221031/04685,31/10/2022,octubre,22:26:00,,DERRAPADO,19.409031,-99.119861,EJE 3 SUR,NICOLAS BRAVO,...,0.0,0.0,1.0,0.0,0.0,,TCE LEVE,RADIO,0.0,
100011,C5/20221031/04892,31/10/2022,octubre,23:17:00,,DERRAPADO,19.400706,-99.137046,CALZ DE TLALPAN,SEGOVIA,...,0.0,0.0,1.0,0.0,0.0,,TCE MODERADO,LLAMADA DEL 911,0.0,
100012,C5/20221031/00739,31/10/2022,octubre,05:22:00,,VOLCADURA,19.385106,-99.186473,EJE 5 SUR,AV REVOLUCION,...,1.0,0.0,0.0,0.0,1.0,,POLICONTUNDIDO POLICONTUNDIDO,LLAMADA DEL 911,0.0,


In [None]:
#Obteniendo el nombre de las columnas
column_names= df.columns.values

In [None]:
columns_names_list=list(column_names)

In [None]:
for x in columns_names_list:
    print(x)

no_folio
fecha_evento
mes
hora
condicion
tipo_de_evento
coordenada_x
coordenada_y
punto_1
punto_2
colonia
alcaldia
tipo_de_interseccion
tipo_de_vehiculo_1
tipo_de_vehiculo_2
tipo_de_vehiculo_3
tipo_de_vehiculo_4
marca_de_vehiculo_1
marca_de_vehiculo_2
marca_de_vehiculo_3
marca_de_vehiculo_4
lesiones
edad_occiso
edad_lesionado
se_desconoce_occiso
se_desconoce_lesionado
rango_de_edades_menores_de_1_ano_lesionado
rango_edades_1_4_occiso
rango_edades_1_4_lesionado
rango_edades_5_14_occiso
rango_edades_5_14_lesionado
rango_edades_15_24_occiso
rango_edades_15_24_lesionado
rango_edades_25_34_occiso
rango_edades_25_34_lesionado
rango_edades_35_44_occiso
rango_edades_35_44_lesionado
rango_edades_45_64_occiso
rango_edades_45_64_lesionado
rango_edades_65_occiso
rango_edades_65_lesionado
total_occisos
occisos_femeninos
occisos_masculinos
occiso_se_desconoce
total_lesionados
lesionados_femeninos
lesionados_masculinos
lesionado_se_desconoce
identidad
unidad_medica_de_apoyo
lugar_del_deceso
trasladad

<h1>Variables a considerar

<h4>Las variables más importantes para analizar en este dataset son:
    
    <ul>
        <li>Mes</li>
        <li>Hora</li>
        <li>Tipo_de_evento</li>
        <li>Tipo de intersección<li>
        <li>Alcaldía</li>
        <li>Tipo de vehículo 1,2,3 y 4<li>
        <li>Total occisos</li>
        <li>Total lesionados</li>
        <li>peaton_occiso></li>
        <li>peaton_lesionado</li>
        <li>ciclista_occiso</li>
        <li>ciclista_lesionado</li>
        <li>pasajero_occiso</li>
        <li>pasajero_lesionado</li>
        <li>motociclista_occiso</li>
        <li>motociclista_lesionado</li>
        <li>conductor_occiso<li>
        <li>conductor_lesionado</li>