# 🔍 RAG Empresarial con Azure AI Foundry (.NET)

## 📋 Objetivos de Aprendizaje

Este cuaderno demuestra cómo construir sistemas RAG (Generación Aumentada por Recuperación) de nivel empresarial utilizando el Microsoft Agent Framework en .NET con Azure AI Foundry. Aprenderás a crear agentes listos para producción que puedan buscar en documentos y proporcionar respuestas precisas y contextuales con seguridad y escalabilidad empresarial.

**Capacidades Empresariales de RAG que Desarrollarás:**
- 📚 **Inteligencia Documental**: Procesamiento avanzado de documentos con servicios de Azure AI
- 🔍 **Búsqueda Semántica**: Búsqueda vectorial de alto rendimiento con características empresariales
- 🛡️ **Integración de Seguridad**: Acceso basado en roles y patrones de protección de datos
- 🏢 **Arquitectura Escalable**: Sistemas RAG listos para producción con monitoreo

## 🎯 Arquitectura Empresarial de RAG

### Componentes Empresariales Clave
- **Azure AI Foundry**: Plataforma de IA empresarial gestionada con seguridad y cumplimiento
- **Agentes Persistentes**: Agentes con historial de conversación y gestión de contexto
- **Gestión de Almacén Vectorial**: Indexación y recuperación de documentos de nivel empresarial
- **Integración de Identidad**: Autenticación con Azure AD y control de acceso basado en roles

### Beneficios Empresariales de .NET
- **Seguridad de Tipos**: Validación en tiempo de compilación para operaciones RAG y estructuras de datos
- **Rendimiento Asíncrono**: Procesamiento de documentos y operaciones de búsqueda sin bloqueo
- **Gestión de Memoria**: Uso eficiente de recursos para colecciones de documentos grandes
- **Patrones de Integración**: Integración nativa con servicios de Azure mediante inyección de dependencias

## 🏗️ Arquitectura Técnica

### Pipeline Empresarial de RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Componentes Clave de .NET
- **Azure.AI.Agents.Persistent**: Gestión de agentes empresariales con persistencia de estado
- **Azure.Identity**: Autenticación integrada para acceso seguro a servicios de Azure
- **Microsoft.Agents.AI.AzureAI**: Implementación del marco de agentes optimizado para Azure
- **System.Linq.Async**: Operaciones LINQ asíncronas de alto rendimiento

## 🔧 Características y Beneficios Empresariales

### Seguridad y Cumplimiento
- **Integración con Azure AD**: Gestión de identidad empresarial y autenticación
- **Acceso Basado en Roles**: Permisos detallados para acceso y operaciones en documentos
- **Protección de Datos**: Cifrado en reposo y en tránsito para documentos sensibles
- **Registro de Auditoría**: Seguimiento completo de actividades para requisitos de cumplimiento

### Rendimiento y Escalabilidad
- **Agrupación de Conexiones**: Gestión eficiente de conexiones a servicios de Azure
- **Procesamiento Asíncrono**: Operaciones sin bloqueo para escenarios de alto rendimiento
- **Estrategias de Caché**: Caché inteligente para documentos de acceso frecuente
- **Balanceo de Carga**: Procesamiento distribuido para implementaciones a gran escala

### Gestión y Monitoreo
- **Verificaciones de Salud**: Monitoreo integrado para componentes del sistema RAG
- **Métricas de Rendimiento**: Análisis detallado sobre calidad de búsqueda y tiempos de respuesta
- **Gestión de Errores**: Manejo completo de excepciones con políticas de reintento
- **Gestión de Configuración**: Configuraciones específicas del entorno con validación

## ⚙️ Prerrequisitos y Configuración

**Entorno de Desarrollo:**
- SDK de .NET 9.0 o superior
- Visual Studio 2022 o VS Code con extensión de C#
- Suscripción a Azure con acceso a AI Foundry

**Paquetes NuGet Requeridos:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configuración de Autenticación en Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuración de Entorno (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Patrones Empresariales de RAG

### Patrones de Gestión Documental
- **Carga Masiva**: Procesamiento eficiente de colecciones grandes de documentos
- **Actualizaciones Incrementales**: Adición y modificación de documentos en tiempo real
- **Control de Versiones**: Versionado de documentos y seguimiento de cambios
- **Gestión de Metadatos**: Atributos ricos y taxonomía para documentos

### Patrones de Búsqueda y Recuperación
- **Búsqueda Híbrida**: Combinación de búsqueda semántica y por palabras clave para resultados óptimos
- **Búsqueda Facetada**: Filtrado y categorización multidimensional
- **Ajuste de Relevancia**: Algoritmos de puntuación personalizados para necesidades específicas del dominio
- **Clasificación de Resultados**: Clasificación avanzada con integración de lógica empresarial

### Patrones de Seguridad
- **Seguridad a Nivel de Documento**: Control de acceso detallado por documento
- **Clasificación de Datos**: Etiquetado automático de sensibilidad y protección
- **Rastros de Auditoría**: Registro completo de todas las operaciones RAG
- **Protección de Privacidad**: Detección y redacción de información personal identificable (PII)

## 🔒 Características de Seguridad Empresarial

### Autenticación y Autorización
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protección de Datos
- **Cifrado**: Cifrado de extremo a extremo para documentos e índices de búsqueda
- **Controles de Acceso**: Integración con Azure AD para permisos de usuarios y grupos
- **Residencia de Datos**: Controles de ubicación geográfica de datos para cumplimiento
- **Respaldo y Recuperación**: Capacidades automatizadas de respaldo y recuperación ante desastres

## 📈 Optimización de Rendimiento

### Patrones de Procesamiento Asíncrono
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gestión de Memoria
- **Procesamiento en Streaming**: Manejo de documentos grandes sin problemas de memoria
- **Agrupación de Recursos**: Reutilización eficiente de recursos costosos
- **Recolección de Basura**: Patrones optimizados de asignación de memoria
- **Gestión de Conexiones**: Ciclo de vida adecuado de conexiones a servicios de Azure

### Estrategias de Caché
- **Caché de Consultas**: Caché de búsquedas ejecutadas con frecuencia
- **Caché de Documentos**: Caché en memoria para documentos más utilizados
- **Caché de Índices**: Caché optimizado de índices vectoriales
- **Caché de Resultados**: Caché inteligente de respuestas generadas

## 📊 Casos de Uso Empresariales

### Gestión del Conocimiento
- **Wiki Corporativo**: Búsqueda inteligente en bases de conocimiento de la empresa
- **Políticas y Procedimientos**: Orientación automatizada sobre cumplimiento y procedimientos
- **Materiales de Capacitación**: Asistencia inteligente para aprendizaje y desarrollo
- **Bases de Datos de Investigación**: Sistemas de análisis de artículos académicos y de investigación

### Atención al Cliente
- **Base de Conocimiento de Soporte**: Respuestas automatizadas para servicio al cliente
- **Documentación de Productos**: Recuperación inteligente de información sobre productos
- **Guías de Solución de Problemas**: Asistencia contextual para resolver problemas
- **Sistemas de Preguntas Frecuentes**: Generación dinámica de FAQs a partir de colecciones de documentos

### Cumplimiento Normativo
- **Análisis de Documentos Legales**: Inteligencia en contratos y documentos legales
- **Monitoreo de Cumplimiento**: Verificación automatizada de cumplimiento normativo
- **Evaluación de Riesgos**: Análisis y reporte de riesgos basados en documentos
- **Soporte de Auditoría**: Descubrimiento inteligente de documentos para auditorías

## 🚀 Despliegue en Producción

### Monitoreo y Observabilidad
- **Application Insights**: Telemetría detallada y monitoreo de rendimiento
- **Métricas Personalizadas**: Seguimiento y alertas de KPI específicos del negocio
- **Rastreo Distribuido**: Seguimiento de solicitudes de extremo a extremo entre servicios
- **Tableros de Salud**: Visualización en tiempo real de la salud y rendimiento del sistema

### Escalabilidad y Confiabilidad
- **Autoescalado**: Escalado automático basado en carga y métricas de rendimiento
- **Alta Disponibilidad**: Despliegue en múltiples regiones con capacidades de conmutación por error
- **Pruebas de Carga**: Validación de rendimiento bajo condiciones de carga empresarial
- **Recuperación ante Desastres**: Procedimientos automatizados de respaldo y recuperación

¿Listo para construir sistemas RAG de nivel empresarial que puedan manejar documentos sensibles a gran escala? ¡Vamos a diseñar sistemas inteligentes de conocimiento para la empresa! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Descargo de responsabilidad**:  
Este documento ha sido traducido utilizando el servicio de traducción automática [Co-op Translator](https://github.com/Azure/co-op-translator). Aunque nos esforzamos por garantizar la precisión, tenga en cuenta que las traducciones automatizadas pueden contener errores o imprecisiones. El documento original en su idioma nativo debe considerarse como la fuente autorizada. Para información crítica, se recomienda una traducción profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones erróneas que puedan surgir del uso de esta traducción.
