# üîç RAG Empresarial com Microsoft Foundry (.NET)

## üìã Objetivos de Aprendizagem

Este notebook demonstra como construir sistemas de Retrieval-Augmented Generation (RAG) de n√≠vel empresarial utilizando o Microsoft Agent Framework em .NET com o Microsoft Foundry. Ir√° aprender a criar agentes prontos para produ√ß√£o que conseguem pesquisar em documentos e fornecer respostas precisas e contextualizadas com seguran√ßa e escalabilidade empresariais.

**Funcionalidades de RAG Empresarial que ir√° Construir:**
- üìö **Document Intelligence**: Processamento avan√ßado de documentos com servi√ßos Azure AI
- üîç **Semantic Search**: Pesquisa vetorial de alto desempenho com funcionalidades empresariais
- üõ°Ô∏è **Security Integration**: Padr√µes de controlo de acesso baseado em fun√ß√µes e prote√ß√£o de dados
- üè¢ **Scalable Architecture**: Sistemas RAG prontos para produ√ß√£o com monitoriza√ß√£o

## üéØ Arquitetura de RAG Empresarial

### Componentes Empresariais Principais
- **Microsoft Foundry**: Plataforma de IA empresarial gerida com seguran√ßa e conformidade
- **Persistent Agents**: Agentes com estado, hist√≥rico de conversa√ß√£o e gest√£o de contexto
- **Vector Store Management**: Indexa√ß√£o e recupera√ß√£o de documentos de n√≠vel empresarial
- **Identity Integration**: Autentica√ß√£o Azure AD e controlo de acesso baseado em fun√ß√µes

### Benef√≠cios .NET para Empresas
- **Type Safety**: Valida√ß√£o em tempo de compila√ß√£o para opera√ß√µes RAG e estruturas de dados
- **Async Performance**: Processamento de documentos e opera√ß√µes de pesquisa n√£o bloqueantes
- **Memory Management**: Utiliza√ß√£o eficiente de recursos para cole√ß√µes de documentos grandes
- **Integration Patterns**: Integra√ß√£o nativa com servi√ßos Azure atrav√©s de dependency injection

## üèóÔ∏è Arquitetura T√©cnica

### Enterprise RAG Pipeline
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Componentes .NET Principais
- **Azure.AI.Agents.Persistent**: Gest√£o empresarial de agentes com persist√™ncia de estado
- **Azure.Identity**: Autentica√ß√£o integrada para acesso seguro a servi√ßos Azure
- **Microsoft.Agents.AI.AzureAI**: Implementa√ß√£o do framework de agentes otimizada para Azure
- **System.Linq.Async**: Opera√ß√µes LINQ ass√≠ncronas de alto desempenho

## üîß Funcionalidades & Benef√≠cios Empresariais

### Seguran√ßa & Conformidade
- **Azure AD Integration**: Gest√£o de identidade empresarial e autentica√ß√£o
- **Role-Based Access**: Permiss√µes granulares para acesso e opera√ß√µes em documentos
- **Data Protection**: Criptografia em repouso e em tr√¢nsito para documentos sens√≠veis
- **Audit Logging**: Rastreio de atividade abrangente para requisitos de conformidade

### Desempenho & Escalabilidade
- **Connection Pooling**: Gest√£o eficiente de liga√ß√µes a servi√ßos Azure
- **Async Processing**: Opera√ß√µes n√£o bloqueantes para cen√°rios de alto d√©bito
- **Caching Strategies**: Caching inteligente para documentos acedidos com frequ√™ncia
- **Load Balancing**: Processamento distribu√≠do para implementa√ß√µes em grande escala

### Gest√£o & Monitoriza√ß√£o
- **Health Checks**: Monitoriza√ß√£o incorporada para os componentes do sistema RAG
- **Performance Metrics**: An√°lise detalhada da qualidade de pesquisa e tempos de resposta
- **Error Handling**: Gest√£o abrangente de exce√ß√µes com pol√≠ticas de retry
- **Configuration Management**: Defini√ß√µes espec√≠ficas por ambiente com valida√ß√£o

## ‚öôÔ∏è Pr√©-requisitos & Configura√ß√£o

**Ambiente de Desenvolvimento:**
- .NET 9.0 SDK ou superior
- Visual Studio 2022 ou VS Code com a extens√£o C#
- Assinatura Azure com acesso ao AI Foundry

**Pacotes NuGet Necess√°rios:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configura√ß√£o de Autentica√ß√£o Azure:**
```bash
# Instale a Azure CLI e autentique-se
az login
az account set --subscription "your-subscription-id"
```

**Configura√ß√£o do Ambiente (ficheiro .env):**
```env
# Microsoft Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Padr√µes de RAG Empresarial

### Padr√µes de Gest√£o de Documentos
- **Bulk Upload**: Processamento eficiente de cole√ß√µes de documentos volumosas
- **Incremental Updates**: Adi√ß√£o e modifica√ß√£o de documentos em tempo real
- **Version Control**: Vers√£o de documentos e rastreio de altera√ß√µes
- **Metadata Management**: Atributos ricos de documentos e taxonomia

### Padr√µes de Pesquisa & Recupera√ß√£o
- **Hybrid Search**: Combina√ß√£o de pesquisa sem√¢ntica e por palavras-chave para resultados √≥timos
- **Faceted Search**: Filtragem e categoriza√ß√£o multidimensional
- **Relevance Tuning**: Algoritmos de pontua√ß√£o personalizados para necessidades espec√≠ficas do dom√≠nio
- **Result Ranking**: Ranking avan√ßado com integra√ß√£o de l√≥gica empresarial

### Padr√µes de Seguran√ßa
- **Document-Level Security**: Controlo de acesso granulado por documento
- **Data Classification**: Etiquetagem autom√°tica de sensibilidade e prote√ß√£o
- **Audit Trails**: Registo abrangente de todas as opera√ß√µes RAG
- **Privacy Protection**: Detec√ß√£o e mascaramento de PII

## üîí Funcionalidades de Seguran√ßa Empresariais

### Autentica√ß√£o & Autoriza√ß√£o
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Prote√ß√£o de Dados
- **Encryption**: Criptografia ponta-a-ponta para documentos e √≠ndices de pesquisa
- **Access Controls**: Integra√ß√£o com Azure AD para permiss√µes de utilizadores e grupos
- **Data Residency**: Controlo geogr√°fico da localiza√ß√£o dos dados para conformidade
- **Backup & Recovery**: Capabilidades automatizadas de backup e recupera√ß√£o de desastres

## üìà Otimiza√ß√£o de Desempenho

### Padr√µes de Processamento Ass√≠ncrono
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gest√£o de Mem√≥ria
- **Streaming Processing**: Lidar com documentos grandes sem problemas de mem√≥ria
- **Resource Pooling**: Reutiliza√ß√£o eficiente de recursos caros
- **Garbage Collection**: Padr√µes de aloca√ß√£o de mem√≥ria otimizados
- **Connection Management**: Ciclo de vida adequado das liga√ß√µes a servi√ßos Azure

### Estrat√©gias de Caching
- **Query Caching**: Cache de pesquisas executadas frequentemente
- **Document Caching**: Cache em mem√≥ria para documentos quentes
- **Index Caching**: Caching otimizado do √≠ndice vetorial
- **Result Caching**: Caching inteligente das respostas geradas

## üìä Casos de Uso Empresariais

### Gest√£o do Conhecimento
- **Corporate Wiki**: Pesquisa inteligente em bases de conhecimento da empresa
- **Policy & Procedures**: Orienta√ß√£o automatizada de conformidade e procedimentos
- **Training Materials**: Assist√™ncia inteligente para aprendizagem e desenvolvimento
- **Research Databases**: Sistemas de an√°lise de papers acad√©micos e de investiga√ß√£o

### Apoio ao Cliente
- **Support Knowledge Base**: Respostas automatizadas de suporte ao cliente
- **Product Documentation**: Recupera√ß√£o inteligente de informa√ß√£o de produto
- **Troubleshooting Guides**: Assist√™ncia contextual para resolu√ß√£o de problemas
- **FAQ Systems**: Gera√ß√£o din√¢mica de FAQs a partir de cole√ß√µes de documentos

### Conformidade Regulamentar
- **Legal Document Analysis**: Intelig√™ncia para contratos e documentos legais
- **Compliance Monitoring**: Verifica√ß√£o automatizada de conformidade regulamentar
- **Risk Assessment**: An√°lise e reporte de risco baseada em documentos
- **Audit Support**: Descoberta inteligente de documentos para auditorias

## üöÄ Implementa√ß√£o em Produ√ß√£o

### Monitoriza√ß√£o & Observability
- **Application Insights**: Telemetria detalhada e monitoriza√ß√£o de desempenho
- **Custom Metrics**: Monitoriza√ß√£o e alertas de KPI espec√≠ficos do neg√≥cio
- **Distributed Tracing**: Rastreio end-to-end de pedidos entre servi√ßos
- **Health Dashboards**: Visualiza√ß√£o em tempo real da sa√∫de e desempenho do sistema

### Escalabilidade & Fiabilidade
- **Auto-Scaling**: Dimensionamento autom√°tico com base na carga e m√©tricas de desempenho
- **High Availability**: Implementa√ß√£o multi-regi√£o com capacidades de failover
- **Load Testing**: Valida√ß√£o de desempenho sob condi√ß√µes de carga empresarial
- **Disaster Recovery**: Procedimentos automatizados de backup e recupera√ß√£o

Pronto para construir sistemas RAG de n√≠vel empresarial que consigam lidar com documentos sens√≠veis em escala? Vamos arquitetar sistemas de conhecimento inteligentes para a empresa! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
Isen√ß√£o de responsabilidade:
Este documento foi traduzido utilizando o servi√ßo de tradu√ß√£o por IA Co-op Translator (https://github.com/Azure/co-op-translator). Apesar de nos esfor√ßarmos por garantir a precis√£o, esteja ciente de que tradu√ß√µes autom√°ticas podem conter erros ou imprecis√µes. O documento original, na sua l√≠ngua original, deve ser considerado a fonte autoritativa. Para informa√ß√µes cr√≠ticas, recomenda-se a tradu√ß√£o por um tradutor profissional. N√£o nos responsabilizamos por quaisquer mal-entendidos ou interpreta√ß√µes incorretas decorrentes da utiliza√ß√£o desta tradu√ß√£o.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
