# Proyecto Big Data – Demo en Colab / Jupyter / Binder

Este notebook permite **probar el recomendador de rutas** y, opcionalmente, la **API REST** usando el grafo del proyecto (almacenes y rutas).

- **Sin MongoDB:** se calcula la ruta mínima por tiempo (grafo fijo).
- **Con MongoDB Atlas:** puedes definir `MONGO_URI` y usar retrasos reales para ponderar las rutas.

| Abrir en | Enlace |
|----------|--------|
| **Google Colab** | [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/gracobjo/proyectobigdata/blob/main/notebooks/ProyectoBigData_Colab.ipynb) |
| **Binder** | [![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/gracobjo/proyectobigdata/HEAD?labpath=notebooks%2FProyectoBigData_Colab.ipynb) |

## 1. Preparar entorno (clonar repo e instalar dependencias)

En **Colab** descomenta y ejecuta la primera celda para clonar el repo. En **Binder** o **Jupyter local** con el repo ya clonado, puedes saltar o comentar el `!git clone`.

In [None]:
# En Google Colab: clonar el repo (cambia USUARIO/REPO por tu fork si lo tienes)
import os
import sys

REPO = "https://github.com/gracobjo/proyectobigdata.git"
PROJECT_DIR = "ProyectoBigData"

if not os.path.isdir(PROJECT_DIR):
    !git clone --depth 1 {REPO} {PROJECT_DIR}

os.chdir(PROJECT_DIR)
sys.path.insert(0, os.getcwd())

# Instalar dependencias ligeras (sin Spark/Airflow)
!pip install -q -r requirements-vercel.txt

print("Entorno listo. CWD:", os.getcwd())

## 2. Demo: recomendador de rutas (sin MongoDB)

Grafo de almacenes (A–E) y rutas. Ruta mínima por tiempo en minutos.

In [None]:
import networkx as nx
from routing.graph_data import EDGES, VERTICES

G = nx.DiGraph()
for (src, dst, route_id, dist_km, time_min) in EDGES:
    G.add_edge(src, dst, weight=time_min, route_id=route_id, km=dist_km)

def path_summary(path, G):
    total = 0
    steps = []
    for i in range(len(path) - 1):
        u, v = path[i], path[i + 1]
        w = G.edges[u, v]["weight"]
        total += w
        steps.append(f"{u} → {v} ({w} min)")
    return total, steps

origin, dest = "A", "D"
path = nx.shortest_path(G, origin, dest, weight="weight")
total_min, steps = path_summary(path, G)

print(f"Ruta recomendada {origin} → {dest}: {", " → ".join(path), "}")
print(f"Tiempo total: {total_min} minutos")
for s in steps:
    print("  ", s)

## 3. (Opcional) Con MongoDB Atlas – retrasos reales

Si tienes **MongoDB Atlas** con la colección `route_delay_aggregates`, define `MONGO_URI` abajo y ejecuta. El recomendador ponderará las aristas por retraso.

In [None]:
import os

# Pega aquí tu URI de MongoDB Atlas (ej: mongodb+srv://user:pass@cluster.xxxxx.mongodb.net/transport_db)
# Si lo dejas vacío, se usará el recomendador sin retrasos (como en la celda anterior).
MONGO_URI = os.environ.get("MONGO_URI", "")  # o asigna directamente: MONGO_URI = "mongodb+srv://..."

if MONGO_URI:
    os.environ["MONGO_URI"] = MONGO_URI
    from routing.route_recommender import recommend_route
    result = recommend_route("A", "D")
    if result:
        print("Ruta (con retrasos MongoDB):", result["path"])
        print("Tiempo efectivo (min):", result.get("total_time_minutes"))
    else:
        print("No hay camino o error de conexión a MongoDB.")
else:
    print("MONGO_URI no definido. Usa la celda anterior para la demo sin MongoDB.")

## 4. (Opcional) Probar la API REST desde el notebook

Si definiste `MONGO_URI` (Atlas), puedes llamar a la API localmente (sin exponerla fuera).

In [None]:
import requests
import os

# Solo si la API está corriendo en este mismo entorno (ver celda opcional más abajo)
API_BASE = "http://127.0.0.1:5000"

try:
    r = requests.get(f"{API_BASE}/health", timeout=2)
    print("API health:", r.json())
    if r.json().get("mongo") == "connected":
        rec = requests.get(f"{API_BASE}/routes/recommend", params={"from_node": "A", "to_node": "D"}, timeout=5)
        print("GET /routes/recommend:", rec.json())
except Exception as e:
    print("La API no está corriendo en 5000. Para levantarla en Colab/Jupyter, ejecuta la celda opcional que inicia uvicorn.")

## 5. (Opcional) Levantar la API en segundo plano

Solo útil si quieres probar la API en este mismo kernel. Necesitas `MONGO_URI` (MongoDB Atlas) para que los endpoints devuelvan datos. En Colab puedes usar después **ngrok** para exponer `/docs` (ver [docs/despliegue-colab-jupyter.md](docs/despliegue-colab-jupyter.md)).

In [None]:
# Descomenta y ejecuta solo si quieres la API en este notebook (y tienes MONGO_URI configurado).
# import threading
# import uvicorn
# def run_api():
#     uvicorn.run("api.main:app", host="0.0.0.0", port=5000)
# t = threading.Thread(target=run_api, daemon=True)
# t.start()
# print("API en http://127.0.0.1:5000 — Swagger: http://127.0.0.1:5000/docs")