In [None]:
# 🏝️ Proyecto Big Data – Turismo Inteligente 2025
# ---------------------------------------------------
# Este script orquesta las fases del proyecto:
# 1. Crear carpetas y estructura
# 2. Definir esquema base
# 3. Generar datos turísticos simulados
# 4. Proceso ETL (limpieza)
# 5. Carga en MongoDB
# 6. Visualización de reportes

# Instalar en tu entorno virtual (solo una vez):
# !pip install nbformat nbconvert

import nbformat
from nbconvert.preprocessors import ExecutePreprocessor
import os

def ejecutar_notebook(ruta_notebook):
    """
    Ejecuta un notebook .ipynb desde la carpeta 'scripts/'.
    """
    if not os.path.exists(ruta_notebook):
        print(f"⚠️ No se encontró el archivo: {ruta_notebook}")
        return

    print(f"\n🚀 Ejecutando: {ruta_notebook}")
    try:
        with open(ruta_notebook, "r", encoding="utf-8") as f:
            nb = nbformat.read(f, as_version=4)
            ep = ExecutePreprocessor(timeout=600, kernel_name="python3")  # timeout de 10 min
            ep.preprocess(nb, {"metadata": {"path": os.path.dirname(ruta_notebook)}})
        print(f"✅ {os.path.basename(ruta_notebook)} ejecutado correctamente.\n")
    except Exception as e:
        print(f"❌ Error al ejecutar {ruta_notebook}: {e}\n")

# 🔢 Fases del proyecto (adaptadas a tu examen)

def fase_1():
    """Crear carpetas del proyecto"""
    ejecutar_notebook("1_Create_files.ipynb")

def fase_2():
    """Crear archivo base.csv con esquema"""
    ejecutar_notebook("2_Create_base.ipynb")

def fase_3():
    """Generar 3000 registros de visitantes (con nulos)"""
    ejecutar_notebook("3_Generar_Data_Turismo.ipynb")

def fase_4():
    """ETL: limpiar datos y guardar visitantes_clean.csv"""
    ejecutar_notebook("4_ETL_Turismo.ipynb")

def fase_5():
    """Cargar datos limpios en MongoDB (TurismoPeru_2025 / Visitantes)"""
    ejecutar_notebook("5_Integrated_NoSQL.ipynb")

def fase_6():
    """Generar reportes visuales en la carpeta 'reports/'"""
    ejecutar_notebook("6_Visualization_report.ipynb")

def ejecutar_todo():
    """Ejecutar todo el flujo del proyecto"""
    print("🔁 Iniciando ejecución completa del pipeline...\n")
    fase_1()
    fase_2()
    fase_3()
    fase_4()
    fase_5()
    fase_6()
    print("🎉 ¡Pipeline completado exitosamente!")

# 🎮 Menú interactivo

def main():
    print("""
===============================================
🏝️  PROYECTO BIG DATA – TURISMO INTELIGENTE 2025
===============================================

Seleccione una fase a ejecutar:
1️⃣  Crear carpetas del proyecto (data, database, reports, etc.)
2️⃣  Crear archivo base.csv con esquema
3️⃣  Generar datos turísticos simulados (visitantes.csv)
4️⃣  Proceso ETL: limpiar datos y generar visitantes_clean.csv
5️⃣  Cargar datos en MongoDB (TurismoPeru_2025 → Visitantes)
6️⃣  Generar reportes visuales (gráficos en 'reports/')
7️⃣  Ejecutar TODO el flujo completo
0️⃣  Salir
""")

    opcion = input("👉 Ingrese una opción (0-7): ")

    if opcion == "1":
        fase_1()
    elif opcion == "2":
        fase_2()
    elif opcion == "3":
        fase_3()
    elif opcion == "4":
        fase_4()
    elif opcion == "5":
        fase_5()
    elif opcion == "6":
        fase_6()
    elif opcion == "7":
        ejecutar_todo()
    elif opcion == "0":
        print("👋 Saliendo del programa...")
    else:
        print("⚠️ Opción no válida. Intente nuevamente.")

# ▶️ Punto de entrada
if __name__ == "__main__":
    main()


🏝️  PROYECTO BIG DATA – TURISMO INTELIGENTE 2025

Seleccione una fase a ejecutar:
1️⃣  Crear carpetas del proyecto (data, database, reports, etc.)
2️⃣  Crear archivo base.csv con esquema
3️⃣  Generar datos turísticos simulados (visitantes.csv)
4️⃣  Proceso ETL: limpiar datos y generar visitantes_clean.csv
5️⃣  Cargar datos en MongoDB (TurismoPeru_2025 → Visitantes)
6️⃣  Generar reportes visuales (gráficos en 'reports/')
7️⃣  Ejecutar TODO el flujo completo
0️⃣  Salir


🚀 Ejecutando: 6_Visualization_report.ipynb
✅ 6_Visualization_report.ipynb ejecutado correctamente.

