# Práctica 5 Automatización y Optimización Avanzada

> Objetivo central: **"Automatiza un stack CRUD completo (modelo, API, tests e infraestructura) orquestando LLMs con LangChain de forma reproducible y medible."**

## ¿Qué voy a lograr y por qué importa?
En esta práctica construyes un **pipeline automatizado** que, partiendo de una configuración declarativa (YAML / Pydantic), genera:
- Modelos Pydantic validados
- Router FastAPI empresarial (CRUD + paginación + auth opcional)
- Suite de tests Pytest
- Infraestructura (Dockerfile, migración Alembic)
- Métricas de eficiencia de la generación

Esto refleja un caso real: equipos que necesitan **acelerar el scaffolding backend** manteniendo estándares de calidad. Aprenderás a usar **LangChain Expression Language (LCEL)** y `RunnableParallel` para ejecutar tareas en paralelo y encadenar dependencias.

Problemas reales que esto resuelve:
- Onboarding lento: crear cada CRUD manualmente tarda horas.
- Inconsistencia entre servicios: estilos diferentes de validación / logs.
- Falta de medición: se generan cosas con IA pero sin métricas.
- Riesgo técnico: prompts desordenados, sin control de dependencias.

Solución mostrada: un **pipeline determinista** donde cada bloque tiene una responsabilidad clara. Así escalas generación de servicios sin sacrificar mantenibilidad.

Rol de las piezas:
- `ResourceConfig` y `FieldConfig`: contrato declarativo de tu recurso.
- Prompts especializados (model, router, tests, infra): separación de dominios (Domain Prompting).
- `RunnableParallel`: acelera la generación base (modelo + config) y luego deriva dependientes.
- `Structured Output`: fuerza esquemas (`InfrastructureComponents`).
- Métricas: base para gobernanza y ROI de IA.

| Concepto | Idea-faro | Analogía |
|----------|-----------|----------|
| LCEL | Orquesta modular | "LEGO de flujos LLM" |
| `RunnableParallel` | Paralelismo declarativo | "Carriles simultáneos" |
| Config → Artefactos | Infra como código pero para scaffolding | "Terraform de tu backend" |
| Prompts especializados | Principio de responsabilidad única | "Microservicios cognitivos" |
| Métricas | Observabilidad del pipeline | "Tablero de control DevOps" |
| Structured Output | Control sintáctico | "Molde para la arcilla del modelo" |


## Práctica paso a paso

### Parte 1: Setup del Entorno

Configuraremos un entorno completo con herramientas de análisis y generación automatizada.

In [None]:
!pip install langchain langchain-openai langchain-community fastapi uvicorn pydantic pytest httpx python-dotenv jinja2 pyyaml click rich

In [None]:
import os
import yaml
import json
import ast
import time
import logging
from pathlib import Path
from typing import Dict, List, Optional, Any, Literal
from dataclasses import dataclass
from datetime import datetime
from jinja2 import Template

# LangChain imports
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import PydanticOutputParser, StrOutputParser
from langchain_core.runnables import RunnableParallel, RunnableLambda
from langchain_core.callbacks import BaseCallbackHandler
from pydantic import BaseModel, Field


In [None]:

from dotenv import load_dotenv
load_dotenv()

if not os.getenv("OPENAI_API_KEY"):
    print("⚠️  Configura OPENAI_API_KEY en tu archivo .env")
else:
    print("✅ OpenAI API Key configurada")

# Configurar modelo
model = ChatOpenAI(model="gpt-5", temperature=0)
print("🤖 Modelo listo")

### 4.2 Modelos de Configuración
Implementaremos un sistema avanzado de generación CRUD usando RunnableParallel y configuración YAML.

In [None]:
from typing import Literal, Union

# Modelos de configuración

class FieldConfig(BaseModel):
    name: str
    type: Literal["int", "float", "str", "bool"]
    description: str = ""
    constraints: Optional[Dict[str, Any]] = None

class ResourceConfig(BaseModel):
    resource_name: str
    class_name: str
    fields: List[FieldConfig]
    auth_required: bool = False
    cache_enabled: bool = False
    pagination: bool = True
    soft_delete: bool = False

In [None]:
# 2. Crear configuración de ejemplo
sample_config = ResourceConfig(
    resource_name="product",
    class_name="Product", 
    fields=[
        FieldConfig(name="name", type="str", description="Nombre del producto", 
                   constraints={"min_length": 1, "max_length": 100}),
        FieldConfig(name="price", type="float", description="Precio en USD",
                   constraints={"ge": 0, "le": 999999}),
        FieldConfig(name="category", type="str", required=False, description="Categoría"),
        FieldConfig(name="stock", type="int", description="Cantidad en inventario",
                   constraints={"ge": 0})
    ],
    auth_required=True,
    cache_enabled=True,
    pagination=True,
    soft_delete=True
)

# Guardar configuración para uso posterior
config_path = Path("resource_configs") 
config_path.mkdir(exist_ok=True)
with open(config_path / "product_config.yaml", "w") as f:
    yaml.dump(sample_config.dict(), f, default_flow_style=False)



### Parte 3: Generadores Especializados con RunnableParallel

Crearemos generadores especializados que trabajen en paralelo para máxima eficiencia.

Se crean 4 generadores:
1. `model_generator`: produce modelos Pydantic (entrada, salida, update, validaciones y validators).
2. `router_generator`: crea router FastAPI con CRUD completo y middlewares condicionales.
3. `tests_generator`: diseña suite Pytest (unit, integration, performance básico, edge cases).
4. `infra_generator`: con `with_structured_output` para garantizar campos (`dockerfile`, `migration`, etc.).

Diseño de prompts: cada uno declara explícitamente criterios de calidad (ej. "nivel PRODUCCIÓN", "validaciones específicas", "logging estructurado"). Esto reduce alucinaciones.


In [None]:
import json
from langchain_core.output_parsers import StrOutputParser

# GENERADORES ESPECIALIZADOS 

class GeneratedComponents(BaseModel):
    modelo_pydantic: str = Field(description="Modelo Pydantic con validaciones avanzadas")
    router_fastapi: str = Field(description="Router FastAPI con CRUD completo")
    tests_pytest: str = Field(description="Suite de tests exhaustiva")
    alembic_migration: str = Field(description="Migración Alembic para base de datos")
    dockerfile: str = Field(description="Dockerfile optimizado")


# Templates
model_generator =(ChatPromptTemplate.from_messages([
        ("system", """Eres experto en Pydantic y diseño de APIs con FastAPI.
        Genera modelos Pydantic de nivel PRODUCCIÓN con:
        - Validaciones específicas por tipo de campo
        - Docstrings detallados con ejemplos
        - Field constraints apropiados
        - Validators personalizados para lógica de negocio
        - Modelos de entrada, salida y actualización separados
        """),
                ("human", """
        CONFIGURACIÓN:
        Resource: {resource_name}
        Class: {class_name}
        Fields: {fields}
        Features: auth={auth_required}, cache={cache_enabled}, soft_delete={soft_delete}

        Genera modelos Pydantic profesionales con validaciones robustas.
        """)
    ])
    | model
    | StrOutputParser()
)


In [None]:
model_generator

In [None]:
# 2. Generador de routers FastAPI completos
router_generator = (
    ChatPromptTemplate.from_messages([
        ("system", """Eres arquitecto senior FastAPI especialista en APIs RESTful.
        Genera routers de PRODUCCIÓN con:
        - Endpoints CRUD completos (GET, POST, PUT, PATCH, DELETE)
        - Paginación, filtrado y ordenamiento
        - Manejo de errores HTTP consistente
        - Documentación OpenAPI rica
        - Middlewares de auth y cache según configuración
        - Logging estructurado
        - Validación de permisos
        """),
                ("human", """
        MODELO PYDANTIC:
        {modelo_pydantic}

        CONFIGURACIÓN:
        {config}

        Genera router FastAPI de nivel empresarial.
    """)
    ])
    | model
    | StrOutputParser()
)

In [None]:
router_generator

In [None]:
# 3. Generador de tests exhaustivos
tests_generator = (
    ChatPromptTemplate.from_messages([
        ("system", """Eres QA Lead especialista en testing de APIs.
        Genera suite de tests COMPREHENSIVA con:
        - Tests unitarios para cada endpoint
        - Tests de integración end-to-end
        - Tests de performance básicos
        - Tests de seguridad (auth, validation)
        - Tests de casos borde y error handling
        - Fixtures y mocks apropiados
        - Cobertura de al menos 90%
        """),
                ("human", """
        ROUTER FASTAPI:
        {router_fastapi}

        MODELO PYDANTIC:
        {modelo_pydantic}

        CONFIGURACIÓN:
        {config}

        Genera tests pytest de nivel empresarial.
        """)
    ])
    | model
    | StrOutputParser()
)

In [None]:
tests_generator

In [None]:
# 4. Modelo para infraestructura
class InfrastructureComponents(BaseModel):
    dockerfile: str = Field(description="Dockerfile multi-stage optimizado")
    migration: str = Field(description="Migración Alembic con índices")
    docker_compose: str = Field(description="Docker-compose para desarrollo", default="")
    deployment_script: str = Field(description="Script de deployment", default="")

# 4. Generador de infraestructura (Docker, migrations) - corregido
infra_generator = ChatPromptTemplate.from_messages([
    ("system", """Eres DevOps senior especialista en containerización y databases.
    Genera infraestructura de PRODUCCIÓN:
    - Dockerfile multi-stage optimizado
    - Migración Alembic con índices apropiados
    - Docker-compose para desarrollo
    - Scripts de deployment
    """),
        ("human", """
    CONFIGURACIÓN:
    {config}

    MODELO PYDANTIC:
    {modelo_pydantic}

    Genera infraestructura completa para producción.
    """)
]) | model.with_structured_output(InfrastructureComponents)

### 4.4 Orquestación LCEL
Función `create_advanced_crud_pipeline()`:
- Fase base paralela: genera `modelo` y pasa `config` intacta.
- Lambda intermedia `_generate_dependent_components`: usa salida anterior para generar router y luego en paralelo tests + infraestructura.
- Se empaqueta todo en un `GeneratedComponents` final.

Ventaja: minimiza latencia (paraleliza lo que no depende) y mantiene orden lógico de dependencias (modelo → router → tests/infra).

In [None]:
def _generate_dependent_components(base_components):
    config = base_components["config"]
    modelo = base_components["modelo"]

    router = router_generator.invoke({
        "modelo_pydantic": modelo,
        "config": json.dumps(config, indent=2, ensure_ascii=False)
    })

    parallel_final = RunnableParallel({
        "tests": tests_generator,
        "infra": infra_generator
    })

    final_components = parallel_final.invoke({
        "router_fastapi": router,
        "modelo_pydantic": modelo,
        "config": json.dumps(config, indent=2, ensure_ascii=False)
    })

    infra = final_components["infra"]
    return GeneratedComponents(
        modelo_pydantic=modelo,
        router_fastapi=router,
        tests_pytest=final_components["tests"],
        alembic_migration=infra.migration if infra else "",
        dockerfile=infra.dockerfile if infra else ""
    )

def create_advanced_crud_pipeline():
    parallel_base = RunnableParallel({
        "modelo": model_generator,
        "config": RunnableLambda(lambda x: x)
    })
    return parallel_base | RunnableLambda(_generate_dependent_components)


In [None]:
crud_pipeline = create_advanced_crud_pipeline()

crud_pipeline

### 4.5 Ejecución + Métricas
Se prepara input a partir de `sample_config` y se invoca `crud_pipeline.invoke(pipeline_input)`.

Métricas recolectadas manualmente (se esboza callback pero no se conecta en la ejecución actual):
- Tiempo total de generación
- Conteo de líneas por componente
- Número de clases, endpoints, validators, fixtures, asserts
- Cálculo de ROI: (tiempo manual estimado / tiempo IA)


In [None]:
# EJECUCIÓN DEL PIPELINE CON MÉTRICAS AVANZADAS

# 1. Callback para capturar métricas detalladas
class CRUDGenerationMetrics(BaseCallbackHandler):
    def __init__(self):
        self.metrics = {
            "start_time": None,
            "end_time": None,
            "components_generated": 0,
            "total_tokens": 0,
            "llm_calls": 0,
            "parallel_executions": 0,
            "errors": 0,
            "component_times": {}
        }
        self.current_component = None
        self.component_start = None
    
    def on_chain_start(self, serialized, inputs, **kwargs):
        if not self.metrics["start_time"]:
            self.metrics["start_time"] = time.time()
        self.component_start = time.time()
    
    def on_chain_end(self, outputs, **kwargs):
        if self.component_start:
            duration = time.time() - self.component_start
            component_name = self.current_component or "unknown"
            self.metrics["component_times"][component_name] = duration
            self.metrics["components_generated"] += 1
        
        self.metrics["end_time"] = time.time()
    
    def on_llm_start(self, serialized, prompts, **kwargs):
        self.metrics["llm_calls"] += 1
    
    def on_llm_end(self, response, **kwargs):
        if hasattr(response, 'llm_output') and response.llm_output:
            token_usage = response.llm_output.get('token_usage', {})
            self.metrics["total_tokens"] += token_usage.get('total_tokens', 0)
    
    def on_chain_error(self, error, **kwargs):
        self.metrics["errors"] += 1
    
    def get_summary(self):
        total_time = (self.metrics["end_time"] or time.time()) - (self.metrics["start_time"] or time.time())
        return {
            **self.metrics,
            "total_time": total_time,
            "avg_time_per_component": total_time / max(self.metrics["components_generated"], 1),
            "tokens_per_second": self.metrics["total_tokens"] / max(total_time, 1),
            "success_rate": (self.metrics["components_generated"] - self.metrics["errors"]) / max(self.metrics["components_generated"], 1) * 100
        }

# 2. Ejecutar generación con métricas
print("🚀 INICIANDO GENERACIÓN CRUD AUTOMATIZADA...")
print("=" * 60)

metrics_callback = CRUDGenerationMetrics()

In [None]:
sample_config.resource_name

In [None]:
# Preparar input para el pipeline
pipeline_input = {
    "resource_name": sample_config.resource_name,
    "class_name": sample_config.class_name,
    "fields": [f.dict() for f in sample_config.fields],
    "auth_required": sample_config.auth_required,
    "cache_enabled": sample_config.cache_enabled,
    "soft_delete": sample_config.soft_delete
}

pipeline_input

In [None]:
# Ejecutar el pipeline
start_generation = time.time()
generated_components = crud_pipeline.invoke(pipeline_input)
generation_time = time.time() - start_generation

print(f"Generación Completa en {generation_time}")

In [None]:
generated_components

In [None]:
# 3. Análisis de los componentes generados
print("\n" + "=" * 60)
print("📊 ANÁLISIS DE COMPONENTES GENERADOS")
print("=" * 60)

components_analysis = {
    "modelo": {
        "lines": generated_components.modelo_pydantic.count('\n'),
        "classes": generated_components.modelo_pydantic.count('class '),
        "validations": generated_components.modelo_pydantic.count('Field('),
        "validators": generated_components.modelo_pydantic.count('@validator')
    },
    "router": {
        "lines": generated_components.router_fastapi.count('\n'),
        "endpoints": len([x for x in ['@app.get', '@app.post', '@app.put', '@app.delete'] 
                        if x in generated_components.router_fastapi]),
        "error_handling": generated_components.router_fastapi.count('HTTPException'),
        "documentation": generated_components.router_fastapi.count('summary=')
    },
    "tests": {
        "lines": generated_components.tests_pytest.count('\n'),
        "test_functions": generated_components.tests_pytest.count('def test_'),
        "assertions": generated_components.tests_pytest.count('assert '),
        "fixtures": generated_components.tests_pytest.count('@pytest.fixture')
    }
}

for component, analysis in components_analysis.items():
    print(f"\n🔍 {component.upper()}:")
    for metric, value in analysis.items():
        print(f"  • {metric.replace('_', ' ').title()}: {value}")

In [None]:
print(generated_components.router_fastapi)

### 4.6 Persistencia de Artefactos
Escribe a carpeta `generated_product_api/` solo archivos con contenido.
- `models.py`
- `routes.py`
- `test_api.py`
- `Dockerfile`
- `migration.py`


In [None]:
# 4. Guardar componentes generados
output_dir = Path(f"generated_{sample_config.resource_name}_api")
output_dir.mkdir(exist_ok=True)

files_created = {
    "models.py": generated_components.modelo_pydantic,
    "routes.py": generated_components.router_fastapi,
    "test_api.py": generated_components.tests_pytest,
    "Dockerfile": generated_components.dockerfile,
    "migration.py": generated_components.alembic_migration
}

for filename, content in files_created.items():
    if content.strip():  # Solo crear archivos con contenido
        file_path = output_dir / filename
        file_path.write_text(content)

print(f"\n💾 Archivos generados en: {output_dir}")
print(f"📁 Total archivos: {len([f for f in files_created.values() if f.strip()])}")

Si venías de:
- Prompt Engineering básico → ahora formalizas prompts como componentes reutilizables.
- FastAPI manual → ahora generas scaffolding consistente.
- DevOps / Infra → introduces IaC-like patterns para artefactos de backend.

Idea principal para recordar: **"Estandariza y paraleliza lo generable; reserva tu tiempo humano para lo verdaderamente diferencial."**

Checklist mental (READY):
- ¿Tengo config declarativa? ✅
- ¿Prompts con criterios explícitos? ✅
- ¿Control de dependencias y orden? ✅
- ¿Métricas de eficiencia? ✅
- ¿Artefactos persistidos y reutilizables? ✅

Si venías de:
- Prompt Engineering básico → ahora formalizas prompts como componentes reutilizables.
- FastAPI manual → ahora generas scaffolding consistente.
- DevOps / Infra → introduces IaC-like patterns para artefactos de backend.

Idea principal para recordar: **"Estandariza y paraleliza lo generable; reserva tu tiempo humano para lo verdaderamente diferencial."**

Checklist mental (READY):
- ¿Tengo config declarativa? ✅
- ¿Prompts con criterios explícitos? ✅
- ¿Control de dependencias y orden? ✅
- ¿Métricas de eficiencia? ✅
- ¿Artefactos persistidos y reutilizables? ✅

## Parte 1: Pipeline de Refactoring Inteligente

Implementaremos un sistema que analiza código existente y propone mejoras automáticas basadas en métricas.

In [None]:
# LangChain imports
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import PydanticOutputParser, StrOutputParser
from langchain_core.runnables import RunnableParallel, RunnableLambda
from langchain_core.callbacks import BaseCallbackHandler
from pydantic import BaseModel, Field

# PIPELINE DE REFACTORING INTELIGENTE
from langchain_core.runnables import RunnableParallel, RunnableLambda
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field
from typing import List, Dict, Any

In [None]:
class RefactoringAnalysis(BaseModel):
    """Análisis integral para refactoring"""
    code_issues: List[str] = Field(description="Lista de problemas detectados en el código")
    refactoring_priority: str = Field(description="Alta/Media/Baja prioridad de refactoring")
    improvement_suggestions: List[str] = Field(description="Sugerencias específicas de mejora")
    estimated_effort: str = Field(description="Estimación de esfuerzo: Bajo/Medio/Alto")
    maintainability_score: int = Field(description="Puntuación de mantenibilidad (1-10)")

class RefactoredCode(BaseModel):
    """Código refactorizado con mejoras"""
    improved_code: str = Field(description="Código mejorado y refactorizado")
    changes_summary: List[str] = Field(description="Resumen de cambios realizados")
    performance_improvements: List[str] = Field(description="Mejoras de rendimiento aplicadas")
    code_style_fixes: List[str] = Field(description="Correcciones de estilo de código")

# Parsers
analysis_parser = PydanticOutputParser(pydantic_object=RefactoringAnalysis)
refactoring_parser = PydanticOutputParser(pydantic_object=RefactoredCode)

In [None]:
# Pipeline de análisis y refactoring
def create_refactoring_pipeline():
    """Crear pipeline inteligente de refactoring"""
    
    # Análisis técnico
    technical_analysis = RunnableLambda(
        lambda x: f"""
        Analiza el siguiente código y proporciona un análisis técnico detallado:

        CÓDIGO:
        {x['code']}

        MÉTRICAS DETECTADAS:
        {x['metrics']}

        PATRONES DETECTADOS:
        {x['patterns']}

        Proporciona un análisis integral considerando:
        1. Problemas de complejidad y mantenibilidad
        2. Anti-patrones detectados
        3. Oportunidades de mejora
        4. Priorización de refactoring

        {analysis_parser.get_format_instructions()}
        """
    ) | model | analysis_parser

    # Refactoring inteligente
    intelligent_refactoring = RunnableLambda(
        lambda x: f"""
        Refactoriza el siguiente código basándote en el análisis técnico:

        CÓDIGO ORIGINAL:
        {x['code']}

        ANÁLISIS TÉCNICO:
        {x['analysis']}

        DIRECTRICES DE REFACTORING:
        1. Reducir complejidad ciclomática manteniendo funcionalidad
        2. Aplicar principios SOLID y clean code
        3. Mejorar legibilidad y mantenibilidad
        4. Optimizar rendimiento donde sea posible
        5. Mantener compatibilidad con APIs existentes
        6. Agregar documentación y tipado donde falte

        IMPORTANTE: El código debe seguir mejores prácticas de FastAPI y Pydantic.

        {refactoring_parser.get_format_instructions()}
        """
    ) | model | refactoring_parser

    # Pipeline paralelo
    refactoring_pipeline = RunnableParallel({
        "analysis": technical_analysis,
        "code": RunnableLambda(lambda x: x["code"]),
        "metrics": RunnableLambda(lambda x: x["metrics"]),
        "patterns": RunnableLambda(lambda x: x["patterns"])
    }) | RunnableLambda(
        lambda x: {
            "code": x["code"],
            "analysis": x["analysis"],
            "metrics": x["metrics"],
            "patterns": x["patterns"]
        }
    ) | RunnableParallel({
        "original": RunnableLambda(lambda x: x),
        "refactored": intelligent_refactoring
    })

    return refactoring_pipeline

# Crear pipeline
refactoring_system = create_refactoring_pipeline()

print("🚀 Pipeline de refactoring inteligente creado")
print("  • Análisis técnico automático")
print("  • Refactoring basado en métricas")
print("  • Optimización de código paralela")

In [None]:
refactoring_system

In [None]:
# DEMOSTRACIÓN: Refactoring inteligente de código legacy
import time

# Código de ejemplo con problemas detectables
sample_legacy_code = '''
def process_user_data(data):
    print("Processing user data...")
    result = []
    
    # TODO: Add input validation
    for item in data:
        print(f"Processing item: {item}")
        
        if item["age"] > 18 and item["status"] == "active":
            processed = {}
            processed["id"] = item["id"]
            processed["name"] = item["name"] 
            processed["email"] = item["email"]
            processed["age"] = item["age"]
            processed["processed_at"] = time.time()
            
            # Complex business logic
            if item["subscription"] == "premium":
                if item["region"] == "US":
                    processed["discount"] = 0.1
                    if item["loyalty_years"] > 5:
                        processed["discount"] = 0.15
                        if item["referrals"] > 10:
                            processed["discount"] = 0.2
                elif item["region"] == "EU":
                    processed["discount"] = 0.08
                    if item["loyalty_years"] > 3:
                        processed["discount"] = 0.12
                else:
                    processed["discount"] = 0.05
            else:
                processed["discount"] = 0.0
            
            result.append(processed)
            print(f"Processed user: {processed['name']}")
    
    print(f"Total processed: {len(result)}")
    return result
'''

print("📋 Código legacy de ejemplo cargado")
print("Problemas visibles:")
print("  • Función muy larga y compleja")
print("  • Lógica de negocio anidada")
print("  • TODOs sin resolver")
print("  • Uso excesivo de print")
print("  • Falta de validaciones")

In [None]:
# FUNCIONES DE ANÁLISIS DE CÓDIGO (faltantes)
import ast
import logging

def analyze_code_complexity(code: str) -> Dict[str, Any]:
    """Analizar complejidad del código usando AST"""
    try:
        tree = ast.parse(code)
        
        complexity_score = 0
        functions = []
        issues = []
        
        # Analizar nodos del AST
        for node in ast.walk(tree):
            # Contar estructuras de control (aumentan complejidad)
            if isinstance(node, (ast.If, ast.For, ast.While, ast.With)):
                complexity_score += 1
            # Contar funciones
            elif isinstance(node, ast.FunctionDef):
                functions.append(node.name)
                # Calcular complejidad de la función
                func_complexity = sum(1 for n in ast.walk(node) 
                                    if isinstance(n, (ast.If, ast.For, ast.While, ast.With)))
                if func_complexity > 5:
                    issues.append(f"Función '{node.name}' muy compleja ({func_complexity} puntos)")
        
        # Métricas básicas
        lines = len([line for line in code.split('\n') if line.strip()])
        code_lines = len([line for line in code.split('\n') 
                         if line.strip() and not line.strip().startswith('#')])
        
        # Calcular índice de mantenibilidad (escala 0-100)
        maintainability_index = max(0, 100 - complexity_score * 2 - (code_lines / 10))
        
        # Detectar problemas adicionales
        if 'TODO' in code:
            issues.append("TODOs pendientes en el código")
        if code.count('print(') > 3:
            issues.append("Uso excesivo de print statements")
        if len(functions) == 0:
            issues.append("No hay funciones definidas")
        
        return {
            "complexity_score": complexity_score,
            "average_complexity": complexity_score / max(len(functions), 1),
            "maintainability_index": maintainability_index,
            "code_lines": code_lines,
            "total_lines": lines,
            "functions_count": len(functions),
            "complex_functions": [f for f in functions if f in [issue.split("'")[1] for issue in issues if "muy compleja" in issue]],
            "issues": issues
        }
        
    except SyntaxError as e:
        return {
            "complexity_score": 100,  # Código con errores de sintaxis = alta complejidad
            "average_complexity": 100,
            "maintainability_index": 0,
            "code_lines": 0,
            "total_lines": len(code.split('\n')),
            "functions_count": 0,
            "complex_functions": [],
            "issues": [f"Error de sintaxis: {str(e)}"]
        }

def analyze_code_patterns(code: str) -> Dict[str, List[str]]:
    """Analizar patrones y anti-patrones en el código"""
    good_patterns = []
    anti_patterns = []
    suggestions = []
    
    # Detectar patrones positivos
    if 'def ' in code:
        good_patterns.append("Funciones definidas (modularidad)")
    if '"""' in code or "'''" in code:
        good_patterns.append("Documentación con docstrings")
    if 'try:' in code and 'except' in code:
        good_patterns.append("Manejo de errores implementado")
    if 'class ' in code:
        good_patterns.append("Uso de clases (OOP)")
    if 'import ' in code:
        good_patterns.append("Imports organizados")
    
    # Detectar anti-patrones
    if code.count('if ') > 5 and 'elif' not in code:
        anti_patterns.append("Múltiples if anidados (considerar elif)")
    if 'print(' in code and code.count('print(') > 2:
        anti_patterns.append("Uso excesivo de print (usar logging)")
    if 'TODO' in code:
        anti_patterns.append("TODOs sin resolver")
    if len([line for line in code.split('\n') if len(line) > 100]) > 0:
        anti_patterns.append("Líneas muy largas (>100 caracteres)")
    
    # Contar niveles de indentación
    max_indent = max([len(line) - len(line.lstrip()) for line in code.split('\n')] + [0])
    if max_indent > 16:  # >4 niveles de indentación
        anti_patterns.append(f"Anidamiento profundo ({max_indent//4} niveles)")
    
    # Generar sugerencias
    if 'TODO' in code:
        suggestions.append("Resolver TODOs pendientes")
    if anti_patterns:
        suggestions.append("Refactorizar para reducir complejidad")
    if 'print(' in code:
        suggestions.append("Reemplazar prints con logging estructurado")
    if max_indent > 12:
        suggestions.append("Extraer funciones para reducir anidamiento")
    if code.count('def ') == 0:
        suggestions.append("Dividir código en funciones reutilizables")
    
    return {
        "good_patterns": good_patterns,
        "anti_patterns": anti_patterns,
        "suggestions": suggestions,
        "complexity_indicators": {
            "max_indentation": max_indent,
            "function_count": code.count('def '),
            "print_statements": code.count('print('),
            "todo_count": code.count('TODO')
        }
    }

print("✅ Funciones de análisis de código agregadas:")

In [None]:
# ANÁLISIS AUTOMÁTICO DEL CÓDIGO LEGACY
import asyncio

async def analyze_legacy_code():
    """Ejecutar análisis completo del código legacy"""
    print("🔍 Iniciando análisis automático del código legacy...")
    
    # 1. Análisis de complejidad
    complexity_analysis = analyze_code_complexity(sample_legacy_code)
    print(f"\n📊 ANÁLISIS DE COMPLEJIDAD:")
    print(f"  • Complejidad máxima: {complexity_analysis.get('complexity_score', 'N/A')}")
    print(f"  • Complejidad promedio: {complexity_analysis.get('average_complexity', 'N/A'):.1f}")
    print(f"  • Índice mantenibilidad: {complexity_analysis.get('maintainability_index', 'N/A'):.1f}")
    print(f"  • Líneas de código: {complexity_analysis.get('code_lines', 'N/A')}")
    print(f"  • Funciones complejas: {complexity_analysis.get('complex_functions', [])}")
    
    if complexity_analysis.get('issues'):
        print(f"  ⚠️  PROBLEMAS DETECTADOS:")
        for issue in complexity_analysis['issues']:
            print(f"      - {issue}")
    
    # 2. Análisis de patrones
    pattern_analysis = analyze_code_patterns(sample_legacy_code)
    print(f"\n🔍 ANÁLISIS DE PATRONES:")
    
    if pattern_analysis['good_patterns']:
        print(f"  ✅ Patrones positivos:")
        for pattern in pattern_analysis['good_patterns']:
            print(f"      - {pattern}")
    
    if pattern_analysis['anti_patterns']:
        print(f"  ❌ Anti-patrones detectados:")
        for anti_pattern in pattern_analysis['anti_patterns']:
            print(f"      - {anti_pattern}")
    
    if pattern_analysis['suggestions']:
        print(f"  💡 Sugerencias de mejora:")
        for suggestion in pattern_analysis['suggestions']:
            print(f"      - {suggestion}")
    
    # 3. Preparar datos para pipeline
    analysis_data = {
        "code": sample_legacy_code,
        "metrics": complexity_analysis,
        "patterns": pattern_analysis
    }
    
    print(f"\n✅ Análisis completo - Datos preparados para refactoring")
    return analysis_data

# Ejecutar análisis
legacy_analysis = await analyze_legacy_code()

In [None]:
# EJECUCIÓN DEL REFACTORING INTELIGENTE
async def execute_intelligent_refactoring():
    """Ejecutar el pipeline completo de refactoring"""
    print("🚀 Ejecutando pipeline de refactoring inteligente...")
    

    # Ejecutar pipeline con análisis previo
    refactoring_result = await refactoring_system.ainvoke(legacy_analysis)
    
    # Mostrar análisis técnico
    analysis = refactoring_result['original']['analysis']
    print(f"\n📋 ANÁLISIS TÉCNICO:")
    print(f"  • Prioridad de refactoring: {analysis.refactoring_priority}")
    print(f"  • Esfuerzo estimado: {analysis.estimated_effort}")
    print(f"  • Puntuación mantenibilidad: {analysis.maintainability_score}/10")
    
    print(f"\n⚠️  PROBLEMAS IDENTIFICADOS:")
    for issue in analysis.code_issues:
        print(f"    - {issue}")
    
    print(f"\n💡 SUGERENCIAS DE MEJORA:")
    for suggestion in analysis.improvement_suggestions:
        print(f"    - {suggestion}")
    
    # Mostrar código refactorizado
    refactored = refactoring_result['refactored']
    print(f"\n✨ CÓDIGO REFACTORIZADO:")
    print("="*60)
    print(refactored.improved_code)
    print("="*60)
    
    print(f"\n📝 RESUMEN DE CAMBIOS:")
    for change in refactored.changes_summary:
        print(f"    ✓ {change}")
    
    if refactored.performance_improvements:
        print(f"\n⚡ MEJORAS DE RENDIMIENTO:")
        for improvement in refactored.performance_improvements:
            print(f"    ⚡ {improvement}")
    
    if refactored.code_style_fixes:
        print(f"\n🎨 CORRECCIONES DE ESTILO:")
        for fix in refactored.code_style_fixes:
            print(f"    🎨 {fix}")
    
    return refactoring_result
    

# Ejecutar refactoring
print("Iniciando proceso de refactoring...")
refactoring_results = None


In [None]:
refactoring_results = await execute_intelligent_refactoring()