</p> <p align="center">
  <img src="https://asocolendo.com/wp-content/uploads/2018/05/Logo-UAM.png" alt="Logo Universidad" width="350">
</p>

# Analisis de Accidentes Viales del año 2024 
<p align="left">
  <img src="https://ichef.bbci.co.uk/ace/ws/640/cpsprodpb/17DE6/production/_92666779_gettyimages-169021616.jpg.webp" alt="Accidete Vial" width="350">

### 📚 **Materia:** Técnicas de Programación  
### 👨‍🎓 **Estudiante:** Daniel Zuluaga   
### 👨‍🏫 **Profesor:** Oscar Stiven Morales    
### 🏛️ **Institución:** Universidad Autónoma de Manizales  
### 📅 **Fecha:** 15 de Octubre de 2025

### Objetivo General:
- Analizar los accidentes viales ocurridos durante el año 2024 para identificar los sectores (barrios) con mayor incidencia y los factores que influyen en la gravedad de los accidentes (número de vehículos involucrados y cantidad de heridos).

### Objetivos Especificos: 
- Determinar los barrios con mayor frecuencia de accidentes viales.
- Analizar la relación entre el número de vehículos involucrados y la cantidad de heridos.
- Identificar el tipo de accidente más común.
- Visualizar mediante histogramas, grafico de barras y grafico dedisperción.

## 📂 Carga y visualización inicial de los datos
- En esta sección se importa la libreria de Pandas y se carga el archivo Accidentes_Viales_20251007.csv, el cual contiene los registros de accidentes viales ocurridos durante el año 2024.
- Se muestran las primeras 50 filas del conjunto de datos para tener una estructura base y verificar que la carga se haya realizado correctamente.

In [None]:
#Importar librerías principales
import pandas as pd

#Cargar el archivo CSV
df = pd.read_csv("Accidentes_Viales_20251007.csv")

#Mostrar las primeras 50 filas
df_50 = df.head(50)
df_50


## 📊 Promedio y Desviacion Estandar
- Promedio (media): representa el número promedio de vehículos que participan en los accidentes viales.

- Desviación estándar: indica qué tanto varía el número de vehículos involucrados entre un accidente y otro.

In [None]:
#Calcular promedio
promedio = df_50["Vehiculos Involucrados"].mean()

#Calcular desviación estándar
desviacion = df_50["Vehiculos Involucrados"].std()

print("Promedio de Vehiculos Involucrados:", promedio)
print("Desviación estándar:", desviacion)
df_50

## 🗺️ Análisis de la distribución geográfica de los accidentes

- En esta sección se realiza un conteo de la cantidad de accidentes por zona geográfica (barrio) con el fin de identificar las áreas de la ciudad con mayor número de casos reportados.

- Este tipo de análisis permite detectar patrones espaciales y posibles zonas críticas donde ocurren con más frecuencia los siniestros viales.

- Adicionalmente, los primeros 50 registros del conjunto de datos se guardan en un archivo Excel (Accidentes_50.xlsx)

In [None]:
#Cantidad de casos por zona geográfica(barrio) 
casos_por_barrio = df_50["Barrio"].value_counts()

print("Cantidad de casos por zona geográfica:")
print(casos_por_barrio)

#Guardar el DataFrame en un archivo Excel 
#guardar las primeras 50 filas en un archivo nuevo
df_50.to_excel("Accidentes_50.xlsx", index=False)

print("\nArchivo 'Accidentes_50.xlsx' guardado correctamente.")


## 🔍 Filtrado avanzado de los accidentes viales

#### En esta sección se implementa un menú interactivo de filtrado que permite al usuario seleccionar diferentes criterios para analizar los datos según su interés.

#### El sistema realiza el filtrado a partir de las siguientes opciones:

1. **Barrios con más casos que el promedio: muestra únicamente las zonas que superan el número medio de accidentes registrados.**

2. **Accidentes con más de 2 vehículos involucrados: identifica los siniestros de mayor magnitud.**

3. **Tipo de accidente: permite buscar accidentes específicos (por ejemplo, “Choque” o “Atropello”).**

4. **Accidentes con heridos: filtra los registros donde el número de heridos sea igual o superior al valor indicado por el usuario.**

-El resultado final se muestra en pantalla en formato tabular y se guarda en un archivo Excel (Filtro_Combinado.xlsx) para su posterior análisis.

-Este módulo permite realizar un análisis comparativo y exploratorio, facilitando la identificación de patrones en los accidentes viales según la ubicación, la magnitud y la gravedad de los casos.

In [None]:
print("=== FILTRADO AVANZADO ===")
print("1. Barrios con más casos que el promedio")
print("2. Accidentes con más de 2 vehículos involucrados")
print("3. Filtrar por tipo de accidente (por ejemplo, 'Choque')")
print("4. Accidentes con heridos")
print("5. Salir")

opcion = input("Ingrese el número de la opción que desea: ")

#Copia base de los datos
datos_filtrados = df_50.copy()

# Filtro
if opcion == "1":
    casos_por_barrio = df_50["Barrio"].value_counts()
    promedio_casos = casos_por_barrio.mean()
    barrios_sobre_promedio = casos_por_barrio[casos_por_barrio > promedio_casos].index
    datos_filtrados = df_50[df_50["Barrio"].isin(barrios_sobre_promedio)]
    print("\n✅ Filtro aplicado: barrios sobre el promedio")

elif opcion == "2":
    datos_filtrados = df_50[df_50["Vehiculos Involucrados"] > 2]
    print("\n✅ Filtro aplicado: más de 2 vehículos involucrados")

elif opcion == "3":
    tipo = input("Ingrese el tipo de accidente (por ejemplo, 'Choque'): ")
    datos_filtrados = df_50[df_50["Clase de Accidente"].str.contains(tipo, case=False, na=False)]
    print(f"\n✅ Filtro aplicado: tipo de accidente '{tipo}'")

elif opcion == "4":
    try:
        min_heridos = int(input("Ingrese el número mínimo de heridos: "))
        datos_filtrados = df_50[df_50["Heridos"] >= min_heridos]
        print(f"\n✅ Filtro aplicado: al menos {min_heridos} heridos")
    except ValueError:
        print("\n⚠️ Entrada inválida.")

elif opcion == "5":
    print("\nSaliendo...")
else:
    print("\n❌ Opción no válida.")


if opcion in ["1", "2", "3", "4"]:
    print("\n🔹 RESULTADO FINAL DEL FILTRADO COMBINADO")
    print("========================================")
    print(datos_filtrados.to_string(index=False))
    print("========================================")
    print(f"Total de registros filtrados: {len(datos_filtrados)}")

    archivo_salida = "Filtro_Combinado.xlsx"
    print(f"\nArchivo '{archivo_salida}' guardado correctamente ✅")

## 📈 Histograma de la distribución de vehículos involucrados

- En esta sección se representa gráficamente la distribución de accidentes viales según el número de vehículos involucrados en cada caso.

- El histograma permite observar con mayor claridad qué tan frecuentes son los accidentes que involucran 1, 2, 3 o más vehículos, facilitando la identificación de patrones de ocurrencia y posibles tendencias.


In [None]:
import matplotlib.pyplot as plt


plt.figure(figsize=(8,5))
plt.hist(df_50["Vehiculos Involucrados"], bins=range(1,5), edgecolor="black", alpha=0.7)

plt.title("Distribución de Vehículos Involucrados en Accidentes", fontsize=13)
plt.xlabel("Número de Vehículos Involucrados")
plt.ylabel("Frecuencia de Accidentes")
plt.xticks([1, 2, 3, 4])

plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


## 🏙️ Análisis de los accidentes por zona geográfica (barrio)

- En esta sección se representa gráficamente la cantidad de accidentes viales registrados por barrio, mostrando los 10 sectores con mayor número de casos.

- El gráfico de barras permite identificar de manera visual cuáles son las zonas más afectadas por los siniestros viales, lo cual resulta útil para:

1. Detectar zonas críticas con alta concentración de accidentes.

2. Evaluar la necesidad de mayores controles viales o señalización.

3. Comparar el nivel de incidencia entre diferentes sectores de la ciudad.

4. Este tipo de análisis es fundamental para orientar estrategias de prevención

In [None]:
import matplotlib.pyplot as plt


# Contar accidentes por barrio
casos_por_barrio = df_50["Barrio"].value_counts().head(10)# mostramos los 10 barrios con más casos

plt.figure(figsize=(10,6))
plt.bar(casos_por_barrio.index, casos_por_barrio.values, color="blue", edgecolor="black")

plt.title("Cantidad de Accidentes por Barrio (Top 10)", fontsize=14)
plt.xlabel("Barrio")
plt.ylabel("Número de Accidentes")

plt.xticks(rotation=45, ha="right")
plt.grid(axis="y", linestyle="--", alpha=0.7)

plt.tight_layout()
plt.show()


## 🔬 Relación entre vehículos involucrados y heridos

- En este gráfico de dispersión se muestra la relación entre el número de vehículos involucrados y la cantidad de heridos en los accidentes.

- Cada punto representa un accidente:

- El eje X muestra los vehículos involucrados.

- El eje Y muestra los heridos.

- El color y tamaño del punto indican la magnitud del accidente.

- Este gráfico permite observar si a mayor cantidad de vehículos también aumenta el número de heridos.

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(9,6))

#Tamaño de punto según cantidad de heridos
tamaño_punto = df_50["Heridos"] * 80 # escala del tamaño

plt.scatter(
    df_50["Vehiculos Involucrados"],
    df_50["Heridos"],
    s=tamaño_punto,# tamaño de los puntos
    c=df_50["Vehiculos Involucrados"], # color según vehículos
    cmap="viridis", # paleta de colores profesional
    alpha=0.8,
    edgecolor="black"
)

plt.title("Relación entre Vehículos Involucrados y Número de Heridos", fontsize=14, weight="bold")
plt.xlabel("Número de Vehículos Involucrados", fontsize=12)
plt.ylabel("Número de Heridos", fontsize=12)
plt.colorbar(label="Vehículos Involucrados")  # barra de colores lateral

plt.grid(True, linestyle="--", alpha=0.5)
plt.tight_layout()
plt.show()