# Proyecto Big Data – Gestión de Datos Bancarios

Este script centraliza las fases del proyecto:

1. Generación de datos CSV
2. Limpieza y depuración de datos
3. Inserción de datos en MongoDB
4. Visualización de reportes


In [2]:
"""
🏦 Proyecto Big Data – Orquestador de Fases (main.ipynb)
---------------------------------------------------
Este script permite ejecutar cada fase del proyecto Big Data,
donde cada fase se encuentra implementada en un archivo .ipynb
dentro de la carpeta 'scripts/'.
"""

#Instalar las librerías en la consola del entorno virtual

#!pip install nbformat nbconvert

import nbformat
from nbconvert.preprocessors import ExecutePreprocessor
import os

# Función para ejecutar notebooks

def ejecutar_notebook(ruta_notebook):
    """
    Ejecuta un archivo .ipynb usando nbconvert.
    """
    if not os.path.exists(ruta_notebook):
        print(f"⚠️ No se encontró el archivo: {ruta_notebook}")
        return

    print(f"\n🚀 Ejecutando: {ruta_notebook}")
    try:
        with open(ruta_notebook, "r", encoding="utf-8") as f:
            nb = nbformat.read(f, as_version=4)
            ep = ExecutePreprocessor(timeout=None, kernel_name="python3")
            ep.preprocess(nb, {"metadata": {"path": os.path.dirname(ruta_notebook)}})

        print(f"✅ {os.path.basename(ruta_notebook)} ejecutado correctamente.\n")
    except Exception as e:
        print(f"❌ Error al ejecutar {ruta_notebook}: {e}\n")

# Fases del Proyecto

def fase_1():
    ejecutar_notebook("../BancoDigital_2025A/scripts/1_Create_files.ipynb")

def fase_2():
    ejecutar_notebook("../BancoDigital_2025A/scripts/2_Create_base_files.ipynb")

def fase_3():
    ejecutar_notebook("../BancoDigital_2025A/scripts/3_Random_data_banco.ipynb")

def fase_4():
    ejecutar_notebook("../BancoDigital_2025A/scripts/4_ETL_bank.ipynb")

def fase_5():
    ejecutar_notebook("../BancoDigital_2025A/scripts/5_Integrated_NoSQL.ipynb")

def fase_6():
    ejecutar_notebook("../BancoDigital_2025A/scripts/6_Visualization_report.ipynb")

# Ejecución total del pipeline
def ejecutar_todo():
    fase_1()
    fase_2()
    fase_3()
    fase_4()
    fase_5()
    fase_6()

# Menú principal

def main():
    print("""
=======================================
🏦 PROYECTO BIG DATA – GESTIÓN DE DATOS
=======================================

Seleccione una fase a ejecutar:
1️⃣  Crear estructura de archivos
2️⃣  Crear base de datos inicial
3️⃣  Generar datos aleatorios de banco
4️⃣  Procesar ETL y limpiar datos
5️⃣  Integrar datos en MongoDB (NoSQL)
6️⃣  Visualización de reportes
7️⃣  Ejecutar TODO el flujo completo
0️⃣  Salir
""")

    opcion = input("👉 Ingrese una opción (0-7): ")

    if opcion == "1":
        fase_1()
    elif opcion == "2":
        fase_2()
    elif opcion == "3":
        fase_3()
    elif opcion == "4":
        fase_4()
    elif opcion == "5":
        fase_5()
    elif opcion == "6":
        fase_6()
    elif opcion == "7":
        ejecutar_todo()
    elif opcion == "0":
        print("👋 Saliendo del programa...")
    else:
        print("⚠️ Opción no válida. Intente nuevamente.")


if __name__ == "__main__":
    main()



🏦 PROYECTO BIG DATA – GESTIÓN DE DATOS

Seleccione una fase a ejecutar:
1️⃣  Crear estructura de archivos
2️⃣  Crear base de datos inicial
3️⃣  Generar datos aleatorios de banco
4️⃣  Procesar ETL y limpiar datos
5️⃣  Integrar datos en MongoDB (NoSQL)
6️⃣  Visualización de reportes
7️⃣  Ejecutar TODO el flujo completo
0️⃣  Salir


🚀 Ejecutando: ../BancoDigital_2025A/scripts/2_Create_base_files.ipynb
✅ 2_Create_base_files.ipynb ejecutado correctamente.

