# üîç RAG Empresarial con Azure AI Foundry (.NET)

## üìã Objetivos de Aprendizaje

Este cuaderno demuestra c√≥mo construir sistemas RAG (Generaci√≥n Aumentada por Recuperaci√≥n) de nivel empresarial utilizando el Microsoft Agent Framework en .NET con Azure AI Foundry. Aprender√°s a crear agentes listos para producci√≥n que puedan buscar en documentos y proporcionar respuestas precisas y contextuales con seguridad y escalabilidad empresarial.

**Capacidades Empresariales de RAG que Desarrollar√°s:**
- üìö **Inteligencia Documental**: Procesamiento avanzado de documentos con servicios de Azure AI
- üîç **B√∫squeda Sem√°ntica**: B√∫squeda vectorial de alto rendimiento con caracter√≠sticas empresariales
- üõ°Ô∏è **Integraci√≥n de Seguridad**: Acceso basado en roles y patrones de protecci√≥n de datos
- üè¢ **Arquitectura Escalable**: Sistemas RAG listos para producci√≥n con monitoreo

## üéØ Arquitectura Empresarial de RAG

### Componentes Empresariales Clave
- **Azure AI Foundry**: Plataforma de IA empresarial gestionada con seguridad y cumplimiento
- **Agentes Persistentes**: Agentes con historial de conversaci√≥n y gesti√≥n de contexto
- **Gesti√≥n de Almac√©n Vectorial**: Indexaci√≥n y recuperaci√≥n de documentos de nivel empresarial
- **Integraci√≥n de Identidad**: Autenticaci√≥n con Azure AD y control de acceso basado en roles

### Beneficios Empresariales de .NET
- **Seguridad de Tipos**: Validaci√≥n en tiempo de compilaci√≥n para operaciones RAG y estructuras de datos
- **Rendimiento As√≠ncrono**: Procesamiento de documentos y operaciones de b√∫squeda sin bloqueo
- **Gesti√≥n de Memoria**: Uso eficiente de recursos para colecciones de documentos grandes
- **Patrones de Integraci√≥n**: Integraci√≥n nativa con servicios de Azure mediante inyecci√≥n de dependencias

## üèóÔ∏è Arquitectura T√©cnica

### Pipeline Empresarial de RAG
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Componentes Clave de .NET
- **Azure.AI.Agents.Persistent**: Gesti√≥n de agentes empresariales con persistencia de estado
- **Azure.Identity**: Autenticaci√≥n integrada para acceso seguro a servicios de Azure
- **Microsoft.Agents.AI.AzureAI**: Implementaci√≥n del marco de agentes optimizado para Azure
- **System.Linq.Async**: Operaciones LINQ as√≠ncronas de alto rendimiento

## üîß Caracter√≠sticas y Beneficios Empresariales

### Seguridad y Cumplimiento
- **Integraci√≥n con Azure AD**: Gesti√≥n de identidad empresarial y autenticaci√≥n
- **Acceso Basado en Roles**: Permisos detallados para acceso y operaciones en documentos
- **Protecci√≥n de Datos**: Cifrado en reposo y en tr√°nsito para documentos sensibles
- **Registro de Auditor√≠a**: Seguimiento completo de actividades para requisitos de cumplimiento

### Rendimiento y Escalabilidad
- **Agrupaci√≥n de Conexiones**: Gesti√≥n eficiente de conexiones a servicios de Azure
- **Procesamiento As√≠ncrono**: Operaciones sin bloqueo para escenarios de alto rendimiento
- **Estrategias de Cach√©**: Cach√© inteligente para documentos de acceso frecuente
- **Balanceo de Carga**: Procesamiento distribuido para implementaciones a gran escala

### Gesti√≥n y Monitoreo
- **Verificaciones de Salud**: Monitoreo integrado para componentes del sistema RAG
- **M√©tricas de Rendimiento**: An√°lisis detallado sobre calidad de b√∫squeda y tiempos de respuesta
- **Gesti√≥n de Errores**: Manejo completo de excepciones con pol√≠ticas de reintento
- **Gesti√≥n de Configuraci√≥n**: Configuraciones espec√≠ficas del entorno con validaci√≥n

## ‚öôÔ∏è Prerrequisitos y Configuraci√≥n

**Entorno de Desarrollo:**
- SDK de .NET 9.0 o superior
- Visual Studio 2022 o VS Code con extensi√≥n de C#
- Suscripci√≥n a Azure con acceso a AI Foundry

**Paquetes NuGet Requeridos:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configuraci√≥n de Autenticaci√≥n en Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuraci√≥n de Entorno (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Patrones Empresariales de RAG

### Patrones de Gesti√≥n Documental
- **Carga Masiva**: Procesamiento eficiente de colecciones grandes de documentos
- **Actualizaciones Incrementales**: Adici√≥n y modificaci√≥n de documentos en tiempo real
- **Control de Versiones**: Versionado de documentos y seguimiento de cambios
- **Gesti√≥n de Metadatos**: Atributos ricos y taxonom√≠a para documentos

### Patrones de B√∫squeda y Recuperaci√≥n
- **B√∫squeda H√≠brida**: Combinaci√≥n de b√∫squeda sem√°ntica y por palabras clave para resultados √≥ptimos
- **B√∫squeda Facetada**: Filtrado y categorizaci√≥n multidimensional
- **Ajuste de Relevancia**: Algoritmos de puntuaci√≥n personalizados para necesidades espec√≠ficas del dominio
- **Clasificaci√≥n de Resultados**: Clasificaci√≥n avanzada con integraci√≥n de l√≥gica empresarial

### Patrones de Seguridad
- **Seguridad a Nivel de Documento**: Control de acceso detallado por documento
- **Clasificaci√≥n de Datos**: Etiquetado autom√°tico de sensibilidad y protecci√≥n
- **Rastros de Auditor√≠a**: Registro completo de todas las operaciones RAG
- **Protecci√≥n de Privacidad**: Detecci√≥n y redacci√≥n de informaci√≥n personal identificable (PII)

## üîí Caracter√≠sticas de Seguridad Empresarial

### Autenticaci√≥n y Autorizaci√≥n
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protecci√≥n de Datos
- **Cifrado**: Cifrado de extremo a extremo para documentos e √≠ndices de b√∫squeda
- **Controles de Acceso**: Integraci√≥n con Azure AD para permisos de usuarios y grupos
- **Residencia de Datos**: Controles de ubicaci√≥n geogr√°fica de datos para cumplimiento
- **Respaldo y Recuperaci√≥n**: Capacidades automatizadas de respaldo y recuperaci√≥n ante desastres

## üìà Optimizaci√≥n de Rendimiento

### Patrones de Procesamiento As√≠ncrono
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gesti√≥n de Memoria
- **Procesamiento en Streaming**: Manejo de documentos grandes sin problemas de memoria
- **Agrupaci√≥n de Recursos**: Reutilizaci√≥n eficiente de recursos costosos
- **Recolecci√≥n de Basura**: Patrones optimizados de asignaci√≥n de memoria
- **Gesti√≥n de Conexiones**: Ciclo de vida adecuado de conexiones a servicios de Azure

### Estrategias de Cach√©
- **Cach√© de Consultas**: Cach√© de b√∫squedas ejecutadas con frecuencia
- **Cach√© de Documentos**: Cach√© en memoria para documentos m√°s utilizados
- **Cach√© de √çndices**: Cach√© optimizado de √≠ndices vectoriales
- **Cach√© de Resultados**: Cach√© inteligente de respuestas generadas

## üìä Casos de Uso Empresariales

### Gesti√≥n del Conocimiento
- **Wiki Corporativo**: B√∫squeda inteligente en bases de conocimiento de la empresa
- **Pol√≠ticas y Procedimientos**: Orientaci√≥n automatizada sobre cumplimiento y procedimientos
- **Materiales de Capacitaci√≥n**: Asistencia inteligente para aprendizaje y desarrollo
- **Bases de Datos de Investigaci√≥n**: Sistemas de an√°lisis de art√≠culos acad√©micos y de investigaci√≥n

### Atenci√≥n al Cliente
- **Base de Conocimiento de Soporte**: Respuestas automatizadas para servicio al cliente
- **Documentaci√≥n de Productos**: Recuperaci√≥n inteligente de informaci√≥n sobre productos
- **Gu√≠as de Soluci√≥n de Problemas**: Asistencia contextual para resolver problemas
- **Sistemas de Preguntas Frecuentes**: Generaci√≥n din√°mica de FAQs a partir de colecciones de documentos

### Cumplimiento Normativo
- **An√°lisis de Documentos Legales**: Inteligencia en contratos y documentos legales
- **Monitoreo de Cumplimiento**: Verificaci√≥n automatizada de cumplimiento normativo
- **Evaluaci√≥n de Riesgos**: An√°lisis y reporte de riesgos basados en documentos
- **Soporte de Auditor√≠a**: Descubrimiento inteligente de documentos para auditor√≠as

## üöÄ Despliegue en Producci√≥n

### Monitoreo y Observabilidad
- **Application Insights**: Telemetr√≠a detallada y monitoreo de rendimiento
- **M√©tricas Personalizadas**: Seguimiento y alertas de KPI espec√≠ficos del negocio
- **Rastreo Distribuido**: Seguimiento de solicitudes de extremo a extremo entre servicios
- **Tableros de Salud**: Visualizaci√≥n en tiempo real de la salud y rendimiento del sistema

### Escalabilidad y Confiabilidad
- **Autoescalado**: Escalado autom√°tico basado en carga y m√©tricas de rendimiento
- **Alta Disponibilidad**: Despliegue en m√∫ltiples regiones con capacidades de conmutaci√≥n por error
- **Pruebas de Carga**: Validaci√≥n de rendimiento bajo condiciones de carga empresarial
- **Recuperaci√≥n ante Desastres**: Procedimientos automatizados de respaldo y recuperaci√≥n

¬øListo para construir sistemas RAG de nivel empresarial que puedan manejar documentos sensibles a gran escala? ¬°Vamos a dise√±ar sistemas inteligentes de conocimiento para la empresa! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.



---

**Descargo de responsabilidad**:  
Este documento ha sido traducido utilizando el servicio de traducci√≥n autom√°tica [Co-op Translator](https://github.com/Azure/co-op-translator). Aunque nos esforzamos por garantizar la precisi√≥n, tenga en cuenta que las traducciones automatizadas pueden contener errores o imprecisiones. El documento original en su idioma nativo debe considerarse como la fuente autorizada. Para informaci√≥n cr√≠tica, se recomienda una traducci√≥n profesional realizada por humanos. No nos hacemos responsables de malentendidos o interpretaciones err√≥neas que puedan surgir del uso de esta traducci√≥n.
