Skip to content

royquillca/Proyecto_grupal_DS

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análisis de mercado para evaluar la viabilidad de la incorporación de vehículos eléctricos en el servicio de taxis en la ciudad de Nueva York.

HENRY BOOTCAMP | Proyecto Final


1. Introducción

Se lleva a cabo un análisis del sector de transporte público en los taxis amarillos de la ciudad de Nueva York con el fin de evaluar la viabilidad de invertir en tecnologías sostenibles como la implementación de flotas de vehículos eléctricos. Se analizan datos en NYC de los sonidos registrados por el tráfico, la contaminación en el aire, el movimiento de vehículos por zona y los viajes que realizan los taxis en la ciudad para los 5 Boroughs (distritos) de New York: Manhattan, Brooklyn, Queens, The Bronx & Staten Island.

Se implementa un modelo de Machine Learning para estimar tendencias a futuro de los principales indicadores. Se realiza un Dashboard para la visualización de los datos y resultados obtenidos.

El proyecto se ejecuta bajo metodología ágil Scrum y se desarrolla en cuatro etapas.
Etapa 1: Recopilación de los datos, Etapa 2: Creación de base de datos, Etapa 3: Análisis Económico, KPIs y Etapa 4: Modelo ML.

La gestión del proyecto se desarrolla en:
Actividades Task: Cronograma Gant:


2. Objetivos

  • Identificar patrones y tendencias en los movimientos de taxis en NYC (2010-2022).
  • Investigar la relación entre el movimiento de los taxis y la calidad del aire y la contaminación sonora en NYC, para determinar alguna correlación existente.
  • Realizar un análisis de las ganancias económicas del sector.
  • Desarrollar un Modelo de ML para estimar comportamientos futuros del sector de transporte de taxi en NYC.

3. Desarrollo

3.1 Recursos implementados

  • Gestión del proyecto: Google meet, Trello.
  • EDA, ETL, SQL BD: Python, Beautiful Soup, Pandas, Matplotlib, Seaborn, PySpark, SQLAlchemy , Azure SQL.
  • Business Intelligence & Machine Learning: SQLAlchemy, Plotly, PowerBI, Scikit-learn, Streamlit.
  • Cloud: Azure (Azure Data Factory, Azure Blob Storage, Azure Synapse Analytics)

3.2 Obtencción de los Datos

Los datos se extraen de fuentes oficiales que proporciona New York. Taxi & Limousine Commission y de los datos abiertos de la ciudad Open_Data_NYC.

El Diccionario de los datos puede consultarse en data_dict.


4. ETL/EDA

Se desarrolla un sistema que extrae datos de manera automática de Taxi & Limousine Commission los transforma y los carga por medio de un pipeline a una base de datos SQL en la nube de Azure.

Al realizar el análisis exploratorio de los datos, se determina que:

  • La crisis covid-19 afectó las actividades del sector en 2020.
  • La facturación promedio por día y por vehiculo ha disminuido.
  • Las zonas donde el precio (USD) de los viajes es más costoso son el aeropuerto EWR y Staten island.
  • Los sectores que más viajes registran son el aeropuerto EWR y Manhattan.
  • El borough con la peor calidad de aire, mayor contaminación por ruido y mayor volumen de tráfico vehicular es Manhattan.

Los aspectos más importantes de este proceso se pueden consultar en: ETL y el EDA.


5. Resultados

Se genera un informe de los impactos ambientales positivos que lleva la implementación de determinada cantidad de vehículos eléctricos para la ciudad. 4.REPORTS.

En el presente video muestra el resultado final del proyecto Resultado Final.

5.1 KPIs

  • Porcentaje de la cantidad de viajes proyectada.
  • Porcentaje de la cuota del mercado proyectado.
  • Ingresos brutos por día/mes.
  • Porcentaje de disminución de contaminante (PM 2,5) en el aire por implementar vehículos eléctricos.
  • Reducción porcentual de contaminación acústica por implementar vehículos eléctricos.

5.2 Modelo Machine Learning

Se desarrolla un modelo de forecasting para establecer proyecciones de las tendencias y patrones que presenta el sector de taxis con la data histórica extraída. El modelo ML puede ser consultado en 3.ML.

Se genera un análisis económico con las proyecciones realizadas al sector y puede consultarse en: 4.REPORTS.

5.3 App

Se desarrolla una app que contiene tanto el modelo ML como un dashboard de visualización de datos en Power Bi embebidos para generar métricas y los KPIs establecidos en función al número de vehículos eléctricos que el usuario seleccione.

El nombre de la app es Dataxi y puede ser consultada en: Dataxi

Dataxi le genera al usuario un .pdf descargable con el resumen de las metricas generadas y algunas recomendaciones de inversión que pueden incrementar el rendimiento del capital invertido en un 32%.

Se puede visualizar un ejemplo de este reporte con la implementación de una flota de 1000 taxis eléctricos en:1000_taxis.pdf


6. Conclusiones

El sector de taxis amarillos viene en decrecimiento pre-COVID. La recuperación post-COVID mostró indicadores al alza, pero algunos volvieron a caer debido a la expansión de servcios como Uber. Sin cambios fundamentales, se pronostica una posible crisis del mercado de taxis para mediados de 2024. Invertir en el mercado a la baja puede ser riesgoso pero ofrece oportunidades para destacarse en servicio, sustentabilidad e innovación teniendo cuenta el impacto ambiental positivo que generan los vehículos eléctricos.


Developed by

Franco DATA ENGINEER

Ivanna DATA ANALYST

Jaime DATA ENGINEER

Luciano PROJECT MANAGER & DATA SCIENTIST

Roy DATA ENGINEER

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.5%
  • Python 0.5%