Skip to content

ferkuellar/bigdata-architecture

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 

Repository files navigation

Revolución en Seguridad Vial

Finalidad del Proyecto

El proyecto se enfoca en el análisis y la predicción del riesgo de accidentes de tráfico en los Estados Unidos, utilizando un extenso conjunto de datos que abarca desde febrero de 2016 hasta marzo de 2023. Este conjunto de datos, con aproximadamente 7.7 millones de registros de accidentes, fue recopilado en tiempo real utilizando diversas APIs de tráfico. Las fuentes de información son variadas, incluyendo departamentos de transporte, agencias policiales, cámaras de tráfico y sensores de carreteras.

Objetivos Específicos

  • Predicción de la Severidad de los Accidentes: Utilizar variables como la hora del día, condiciones climáticas y ubicación para modelar y predecir la severidad de los accidentes.
  • Análisis de Hotspots de Accidentes: Identificar áreas geográficas con altas tasas de accidentes.
  • Impacto de las Condiciones Climáticas y Ambientales: Examinar cómo factores como la lluvia, la presión atmosférica y la visibilidad afectan la probabilidad de accidentes.
  • Evaluación de Infraestructuras Viales: Analizar el impacto de las señales de tráfico, rotondas y otros elementos de infraestructura.

Fuentes de Datos:

Componentes de Metodologías y Herramientas Avanzadas:

  • Hadoop y Cluster de Hadoop: Para el procesamiento de grandes volúmenes de datos.
  • BigQuery: Para consultas SQL en datasets muy grandes.
  • Jupyter Notebooks: Para el análisis exploratorio de datos y el prototipado rápido.
  • Datamarts: Para consultas más rápidas y específicas.
  • Streaming de Datos en Tiempo Real: Implementación de un pipeline de datos en tiempo real utilizando Kafka.
  • Almacenamiento en Columnas: Utilidad de Google Bigtable o Apache Cassandra utilizada para consultas analíticas rápidas.
  • Control de Versiones para Datos (DVC): Utilizado para mantener un control de versiones de datasets y modelos de machine learning.
  • Automatización y Orquestación de Flujos de Trabajo: Herramientas como Apache Airflow o Luigi se utilizan para automatizar el pipeline ETL.

Valor Añadido

Este proyecto no solo proporciona análisis estadísticos, sino insights accionables diseñados para impulsar cambios significativos en la seguridad vial. Al combinar tecnologías de vanguardia en el procesamiento y análisis de Big Data, aspiramos a convertir estos millones de registros en una carretera más segura para todos.

Diagrama Conceptual del Proceso ETL

Este documento detalla el diagrama conceptual para entender el flujo del proceso ETL (Extracción, Transformación y Carga). Este proceso está organizado en varias fases, cada una con bloques específicos para describir las tareas necesarias.

Texto alternativo

Conclusión

Este modelo operacional sirve como una guía detallada para implementar y ejecutar el proyecto "Revolución en Seguridad Vial" de manera eficiente y efectiva.

Revisión Final del Proyecto "Revolución en Seguridad Vial"

Resumen

El proyecto "Revolución en Seguridad Vial" tiene como objetivo mejorar significativamente la seguridad en las carreteras de Estados Unidos. Utilizando un conjunto de datos integral de aproximadamente 7.7 millones de registros de accidentes, el proyecto destaca por su ambición de convertir datos en acciones que pueden salvar vidas.

Fortalezas

  • Enfoque Basado en Datos: El proyecto utiliza eficazmente un gran conjunto de datos para obtener ideas significativas.
  • Objetivos Integrales: Desde el modelado predictivo hasta la evaluación del impacto de la COVID-19 en los patrones

Releases

No releases published

Packages

No packages published