# QA Manual

## Report Generator

Este notebook describe un flujo manual para probar la pipeline de reportes.
La idea es inicializar una pipeline y luego ir agregando los steps correspondientes,
ejecutando cada uno y revisando sus artifacts y resultados.

Pasos sugeridos:
1) InitRun: crea el contexto, carpetas y parametros base.
2) LoadConfig: carga la config JSON y normaliza parametros.
3) DiscoverInputs: clasifica archivos de entrada segun reglas.
4) RunExcelETL: consolida los excels en un DataFrame.
5) EnrichWithContext: agrega metadata y filtra columnas relevantes.

En cada paso, verificar:
- ctx.inputs y ctx.artifacts (que existan y tengan contenido esperado).
- ctx.outputs si aplica.
- mensajes de log impresos por cada step.

In [1]:
import os
from pathlib import Path

# Se importa rgenerator, Step, RunContext
from rgenerator.etl.core.step import Step
from rgenerator.etl.core.context import RunContext

# Se agregan los pasos al pipeline
from rgenerator.etl.core.pipeline_steps import (
    InitRun,
    LoadConfig,
    DiscoverInputs,
    RunExcelETL,
    EnrichWithContext,
    ExportConsolidatedExcel,
    DeleteTempFiles)


In [2]:
# Contexto y Pipeline para Simce Lenguaje
simce_context = RunContext(
    evaluation="simce", 
    run_id="test_id", 
    base_dir=Path(os.getcwd()) / "input_test")
pipeline_simce_lenguaje = []

simce_context.show_attrs()

RunContext
  evaluation: simce
  run_id: test_id
  base_dir: c:\Users\magod\Documents\Proyectos\Informes PHP\website-ui\backend\tests\input_test
  params:
  inputs:
  artifacts:
  outputs:
  last_step: None
  status: NEW


In [3]:
step = InitRun(
        run_id="simce_estudiantes_lenguaje",
        evaluation="simce",
        year=2025,
        asignatura="Lenguaje",
    )
step.run(simce_context)


step.show_attrs()
print('-------')
simce_context.show_attrs()

InitRun
  name: InitRun
  description: 
  requires:
  produces:
  params:
    run_id: simce_estudiantes_lenguaje
    evaluation: simce
    year: 2025
    asignatura: Lenguaje
  logs:
    [0] [InitRun] Artifacts sin cambios.
  timestamp: 20260126_125249
-------
RunContext
  evaluation: simce
  run_id: 20260126_125249
  base_dir: c:\Users\magod\Documents\Proyectos\Informes PHP\website-ui\backend\tests\input_test
  params:
    run_id: simce_estudiantes_lenguaje
    evaluation: simce
    year: 2025
    asignatura: Lenguaje
  inputs:
  artifacts:
  outputs:
  last_step: None
  status: RUNNING
  work_dir: c:\Users\magod\Documents\Proyectos\Informes PHP\website-ui\backend\tests\input_test\simce\20260126_125249
  inputs_dir: c:\Users\magod\Documents\Proyectos\Informes PHP\website-ui\backend\tests\input_test\inputs
  aux_dir: c:\Users\magod\Documents\Proyectos\Informes PHP\website-ui\backend\tests\input_test\simce\20260126_125249\aux_files
  outputs_dir: c:\Users\magod\Documents\Proyectos\Infor

In [4]:
step = LoadConfig(config_path=simce_context.base_dir / "../config.yaml")