In [None]:
# Rmarkdown

# Proyecto Big Data ‚Äì Gesti√≥n de Datos Bancarios

# Este script centraliza las fases del proyecto:

# 1. Generaci√≥n de datos CSV
# 2. Limpieza y depuraci√≥n de datos
# 3. Inserci√≥n de datos en MongoDB
# 4. Visualizaci√≥n de reportes

# Python

# """
# üè¶ Proyecto Big Data ‚Äì Orquestador de Fases (main.ipynb)
# ---------------------------------------------------
# Este script permite ejecutar cada fase del proyecto Big Data,
# donde cada fase se encuentra implementada en un archivo .ipynb
# dentro de la carpeta 'scripts/'.
# """
# #Instalar las librer√≠as en la consola del entorno virtual

# !pip install nbformat nbconvert

import nbformat
from nbconvert.preprocessors import ExecutePreprocessor
import os

# Funci√≥n para ejecutar notebooks

def ejecutar_notebook(ruta_notebook):
    """
    Ejecuta un archivo .ipynb usando nbconvert.
    """
    if not os.path.exists(ruta_notebook):
        print(f"‚ö†Ô∏è No se encontr√≥ el archivo: {ruta_notebook}")
        return

    print(f"\nüöÄ Ejecutando: {ruta_notebook}")
    try:
        with open(ruta_notebook, "r", encoding="utf-8") as f:
            nb = nbformat.read(f, as_version=4)
            ep = ExecutePreprocessor(timeout=None, kernel_name="python3")
            ep.preprocess(nb, {"metadata": {"path": os.path.dirname(ruta_notebook)}})

        print(f"‚úÖ {os.path.basename(ruta_notebook)} ejecutado correctamente.\n")
    except Exception as e:
        print(f"‚ùå Error al ejecutar {ruta_notebook}: {e}\n")

# Fases del Proyecto

def fase_1():
    ejecutar_notebook("../BancoDigital_2025/scripts/1_Create_files.ipynb")

def fase_2():
    ejecutar_notebook("../BancoDigital_2025/scripts/2_Create_base_files.ipynb")

def fase_3():
    ejecutar_notebook("../BancoDigital_2025/scripts/3_Random_data_banco.ipynb")

def fase_4():
    ejecutar_notebook("../BancoDigital_2025/scripts/4_ETL_bank.ipynb")

def fase_5():
    ejecutar_notebook("../BancoDigital_2025/scripts/5_Integrated_NoSQL.ipynb")

def fase_6():
    ejecutar_notebook("../BancoDigital_2025/scripts/6_Visualization_report.ipynb")

# Ejecuci√≥n total del pipeline
def ejecutar_todo():
    fase_1()
    fase_2()
    fase_3()
    fase_4()
    fase_5()
    fase_6()

# Men√∫ principal

def main():
    print("""
=======================================
üè¶ PROYECTO BIG DATA ‚Äì GESTI√ìN DE DATOS
=======================================

Seleccione una fase a ejecutar:
1Ô∏è‚É£  Crear estructura de archivos
2Ô∏è‚É£  Crear base de datos inicial
3Ô∏è‚É£  Generar datos aleatorios de banco
4Ô∏è‚É£  Procesar ETL y limpiar datos
5Ô∏è‚É£  Integrar datos en MongoDB (NoSQL)
6Ô∏è‚É£  Visualizaci√≥n de reportes
7Ô∏è‚É£  Ejecutar TODO el flujo completo
0Ô∏è‚É£  Salir
""")

    opcion = input("üëâ Ingrese una opci√≥n (0-7): ")

    if opcion == "1":
        fase_1()
    elif opcion == "2":
        fase_2()
    elif opcion == "3":
        fase_3()
    elif opcion == "4":
        fase_4()
    elif opcion == "5":
        fase_5()
    elif opcion == "6":
        fase_6()
    elif opcion == "7":
        ejecutar_todo()
    elif opcion == "0":
        print("üëã Saliendo del programa...")
    else:
        print("‚ö†Ô∏è Opci√≥n no v√°lida. Intente nuevamente.")


if __name__ == "__main__":
    main()
