# Tutorial de Airflow Config

Este notebook demuestra el uso de la librería `airflow-etl-config` para gestionar configuraciones y estructuras de proyectos ETL.

## 1. Instalación

Instalamos la librería en modo editable.

In [None]:
!pip install -e .

## 2. Explorar Plantillas Disponibles

Antes de crear configuraciones, veamos qué plantillas soporta la librería.

In [None]:
from airflow_config import get_available_templates

templates = get_available_templates()
print("Plantillas disponibles:", templates)

## 3. Crear una Configuración ETL (Básica)

Generamos un archivo de configuración básico para un pipeline que mueve datos de PostgreSQL a BigQuery.

In [None]:
from airflow_config import create_etl_pipeline

# Crear archivo de configuración
create_etl_pipeline(
    source="postgresql",
    destination="bigquery",
    config_file="demo_config.py"
)

# Verificar que se creó el archivo
import os
print(f"Archivo creado: {os.path.exists('demo_config.py')}")

### Ver contenido generado
Veamos cómo luce el archivo generado.

In [None]:
!cat demo_config.py

## 4. Crear una Configuración Avanzada (Data Pipeline)

Para casos más complejos, podemos definir múltiples secciones personalizadas.

In [None]:
from airflow_config import AirflowConfig

# Inicializamos el gestor apuntando a un nuevo archivo
advanced_config = AirflowConfig("advanced_config.py")

# Definimos las secciones y sus tipos de plantilla
sections = {
    "main_db": "postgresql",
    "analytics": "bigquery",
    "cache": "redis",
    "events": "kafka",
    "api_external": "api_keys"
}

# Generamos la configuración
advanced_config.create_data_pipeline(sections)

print("Configuración avanzada creada.")

## 5. Cargar y Usar Configuraciones

Cargamos el archivo generado y accedemos a sus variables de diferentes formas.

In [None]:
# Cargar configuración
config = AirflowConfig("demo_config.py")

# 1. Listar variables
print(f"Total variables: {len(config.variables)}")

# 2. Obtener variable individual
host = config.get_variable("SOURCE_POSTGRES_HOST")
print(f"Host de origen: {host}")

# 3. Validar sección
is_valid = config.validate_section("source")
print(f"¿Sección 'source' válida?: {is_valid}")

### Obtener Parámetros de Conexión
Esta es una función clave para pasar configuraciones limpias a los operadores de Airflow.

In [None]:
# Obtiene un diccionario limpio (sin prefijos) para la sección 'source'
pg_params = config.get_connection_params("source")
print("Parámetros PostgreSQL:", pg_params)

# Obtiene parámetros para 'destination'
bq_params = config.get_connection_params("destination")
print("Parámetros BigQuery:", bq_params)

## 6. Generar Estructura de Proyecto (Scaffolding)

Creamos la estructura de carpetas para un nuevo proyecto.

In [None]:
from airflow_config import create_project_structure

project_name = "mi_proyecto_demo"
create_project_structure(project_name)

## 7. Ejecutar Pruebas

Ejecutamos la suite de pruebas para verificar que todo funciona correctamente.

In [None]:
!python3 run_tests.py