# üöå TR-01: Transporte masivo (LATAM) ‚Äì GTFS/GTFS-RT y m√©tricas operativas

Este cuaderno gu√≠a la ingesti√≥n y an√°lisis de datos GTFS/GTFS-RT aplicados al contexto LATAM, con foco en validaci√≥n de esquema, procesamiento geoespacial, m√©tricas de operaci√≥n y visualizaciones.

## 1) Configurar entorno y dependencias

- Librer√≠as: `pandas`, `geopandas`, `numpy`, `matplotlib`, `folium`/`leafmap`, `partridge` o `gtfs_kit`, `pytz`, `plotly`.
- Instalar en el venv del repo (VS Code Terminal):
```pwsh
F:\GitHub\supply-chain-data-notebooks\.venv\Scripts\python.exe -m pip install geopandas folium leafmap partridge pytz plotly
```
- Cargar librer√≠as en las celdas de c√≥digo siguientes.

In [None]:
# Placeholder: importaci√≥n de librer√≠as (ajuste seg√∫n tu entorno)
import pandas as pd
import numpy as np

## 2) Cargar y validar paquete GTFS (esquema)
Archivos esperados: `agency.txt`, `routes.txt`, `trips.txt`, `stops.txt`, `stop_times.txt`, `shapes.txt`, `calendar.txt` y/o `calendar_dates.txt`. Validar presencia y tipos de columnas clave (`route_id`, `trip_id`, `stop_id`).

In [None]:
# Placeholder: lectura GTFS (sin implementar)
# Sugerencia: usar partridge o gtfs_kit para leer el ZIP y acceder a tablas.
gtfs_zip_path = "path/a/tu_feed_gtfs.zip"
# TODO: implementar lectura con partridge/gtfs_kit y validaciones de columnas obligatorias.

## 3) Normalizar y limpiar datos para LATAM
- Normalizar encoding UTF-8 y nombres de `agency`, resolver zonas horarias (`America/Santiago`, `America/Mexico_City`, `America/Bogota`).
- Mapear `route_type` locales a est√°ndar GTFS.
- Unificar formatos de `stop_id`/`trip_id`.
- Integrar feriados locales desde `calendar_dates.txt`.

## 4) Construir tablas relacionales: agency, routes, trips, stops, shapes
- Unir `trips` con `routes` y `shapes`.
- Generar √≠ndices y columnas para an√°lisis (ej. `servicio_diario`, `sentido`, `vehiculo_tipo`).
- Snippets para joins eficientes con `pandas`/`geopandas`.

## 5) Generar geometr√≠as y GeoDataFrames (paradas y trazas)
- Crear `GeoDataFrame` de paradas (Point) y trazas de ruta (LineString) a partir de `shapes.txt`.
- Proyectar a CRS m√©tricos (ej. EPSG:3857 / CRS locales).
- Simplificaci√≥n de trazas y c√°lculo de distancias entre paradas.

## 6) Calcular m√©tricas operativas b√°sicas (headway, span, trips/d√≠a)
- Headway por l√≠nea/segmento: media de diferencias entre salidas, $h=\mathrm{mean}(\Delta t)$.
- Span de servicio: primer/√∫ltimo viaje.
- Trips/d√≠a por `route_id` y cobertura espacial.

## 7) Puntualidad y desempe√±o usando GTFS-RT o simulaci√≥n
- Ingesta b√°sica de GTFS-RT (posiciones) o simulaci√≥n de retrasos.
- Vincular con `trips` GTFS y calcular puntualidad.
- OTP: $$\mathrm{OTP}=\frac{N_{\text{on-time}}}{N_{\text{total}}}$$, umbrales t√≠picos ¬±5 min; m√©tricas por hora/segmento.

In [None]:
# Placeholder: GTFS-RT (sin implementar)
gtfs_rt_endpoint = "url/a/gtfs-rt.pb"
# TODO: fetch y parse de protobuf/JSON, v√≠nculo con trips y c√°lculo de puntualidad.

## 8) Estimaci√≥n de capacidad y niveles de servicio
- Capacidad por viaje usando tablas de veh√≠culo o supuestos.
- C√°lculo de **load factor** y nivel de servicio por parada y por hora.
- M√©tricas: pasajeros estimados / capacidad, frecuencia efectiva.

## 9) Visualizaciones interactivas y paneles
- Mapas con `folium`/`leafmap` para rutas/paradas.
- Series temporales (headways, OTP) con `plotly`.
- Heatmaps de cobertura y demanda estimada.
- Exportar HTML interactivo.

## 10) Exportar m√©tricas y reportes
- Guardar tablas resumen en CSV/JSON y GeoPackage.
- Comandos para escribir en disco y visualizar resultados en VS Code Output.

## 11) Pruebas unitarias y verificaci√≥n en VS Code
- Tests con `pytest` para funciones cr√≠ticas: validaci√≥n de esquema, c√°lculo de headway, v√≠nculo GTFS-RT.
- Ejecutar en el runner integrado y revisar el panel de pruebas.