# 🔍 RAG Empresarial com Azure AI Foundry (.NET)

## 📋 Objetivos de Aprendizagem

Este notebook demonstra como construir sistemas de Recuperação e Geração Aumentada (RAG) de nível empresarial usando o Microsoft Agent Framework em .NET com Azure AI Foundry. Você aprenderá a criar agentes prontos para produção que podem pesquisar documentos e fornecer respostas precisas e contextualizadas com segurança e escalabilidade empresarial.

**Recursos de RAG Empresarial que Você Vai Construir:**
- 📚 **Inteligência de Documentos**: Processamento avançado de documentos com serviços Azure AI
- 🔍 **Busca Semântica**: Busca vetorial de alto desempenho com recursos empresariais
- 🛡️ **Integração de Segurança**: Controle de acesso baseado em funções e padrões de proteção de dados
- 🏢 **Arquitetura Escalável**: Sistemas RAG prontos para produção com monitoramento

## 🎯 Arquitetura de RAG Empresarial

### Componentes Principais Empresariais
- **Azure AI Foundry**: Plataforma de IA empresarial gerenciada com segurança e conformidade
- **Agentes Persistentes**: Agentes com estado persistente e gerenciamento de histórico de conversas e contexto
- **Gerenciamento de Armazenamento Vetorial**: Indexação e recuperação de documentos de nível empresarial
- **Integração de Identidade**: Autenticação Azure AD e controle de acesso baseado em funções

### Benefícios Empresariais do .NET
- **Segurança de Tipos**: Validação em tempo de compilação para operações RAG e estruturas de dados
- **Desempenho Assíncrono**: Processamento de documentos e operações de busca não bloqueantes
- **Gerenciamento de Memória**: Utilização eficiente de recursos para grandes coleções de documentos
- **Padrões de Integração**: Integração nativa com serviços Azure usando injeção de dependência

## 🏗️ Arquitetura Técnica

### Pipeline de RAG Empresarial
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Componentes Principais do .NET
- **Azure.AI.Agents.Persistent**: Gerenciamento de agentes empresariais com persistência de estado
- **Azure.Identity**: Autenticação integrada para acesso seguro aos serviços Azure
- **Microsoft.Agents.AI.AzureAI**: Implementação do framework de agentes otimizado para Azure
- **System.Linq.Async**: Operações LINQ assíncronas de alto desempenho

## 🔧 Recursos e Benefícios Empresariais

### Segurança e Conformidade
- **Integração com Azure AD**: Gerenciamento de identidade empresarial e autenticação
- **Controle de Acesso Baseado em Funções**: Permissões detalhadas para acesso e operações em documentos
- **Proteção de Dados**: Criptografia em repouso e em trânsito para documentos sensíveis
- **Registro de Auditoria**: Rastreamento abrangente de atividades para requisitos de conformidade

### Desempenho e Escalabilidade
- **Pooling de Conexões**: Gerenciamento eficiente de conexões com serviços Azure
- **Processamento Assíncrono**: Operações não bloqueantes para cenários de alta demanda
- **Estratégias de Cache**: Cache inteligente para documentos acessados frequentemente
- **Balanceamento de Carga**: Processamento distribuído para implantações em larga escala

### Gerenciamento e Monitoramento
- **Verificações de Saúde**: Monitoramento integrado para componentes do sistema RAG
- **Métricas de Desempenho**: Análises detalhadas sobre qualidade de busca e tempos de resposta
- **Tratamento de Erros**: Gerenciamento abrangente de exceções com políticas de repetição
- **Gerenciamento de Configuração**: Configurações específicas de ambiente com validação

## ⚙️ Pré-requisitos e Configuração

**Ambiente de Desenvolvimento:**
- SDK .NET 9.0 ou superior
- Visual Studio 2022 ou VS Code com extensão C#
- Assinatura Azure com acesso ao AI Foundry

**Pacotes NuGet Necessários:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configuração de Autenticação Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuração de Ambiente (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Padrões de RAG Empresarial

### Padrões de Gerenciamento de Documentos
- **Upload em Massa**: Processamento eficiente de grandes coleções de documentos
- **Atualizações Incrementais**: Adição e modificação de documentos em tempo real
- **Controle de Versão**: Versionamento de documentos e rastreamento de alterações
- **Gerenciamento de Metadados**: Atributos ricos e taxonomia de documentos

### Padrões de Busca e Recuperação
- **Busca Híbrida**: Combinação de busca semântica e por palavras-chave para resultados ótimos
- **Busca Facetada**: Filtragem e categorização multidimensional
- **Ajuste de Relevância**: Algoritmos de pontuação personalizados para necessidades específicas do domínio
- **Classificação de Resultados**: Classificação avançada com integração de lógica de negócios

### Padrões de Segurança
- **Segurança em Nível de Documento**: Controle de acesso detalhado por documento
- **Classificação de Dados**: Rotulagem automática de sensibilidade e proteção
- **Trilhas de Auditoria**: Registro abrangente de todas as operações RAG
- **Proteção de Privacidade**: Detecção e redação de informações pessoais identificáveis (PII)

## 🔒 Recursos de Segurança Empresarial

### Autenticação e Autorização
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Proteção de Dados
- **Criptografia**: Criptografia ponta a ponta para documentos e índices de busca
- **Controles de Acesso**: Integração com Azure AD para permissões de usuários e grupos
- **Residência de Dados**: Controles de localização geográfica de dados para conformidade
- **Backup e Recuperação**: Recursos automatizados de backup e recuperação de desastres

## 📈 Otimização de Desempenho

### Padrões de Processamento Assíncrono
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gerenciamento de Memória
- **Processamento em Streaming**: Manipulação de grandes documentos sem problemas de memória
- **Pooling de Recursos**: Reutilização eficiente de recursos caros
- **Coleta de Lixo**: Padrões otimizados de alocação de memória
- **Gerenciamento de Conexões**: Ciclo de vida adequado de conexões com serviços Azure

### Estratégias de Cache
- **Cache de Consultas**: Cache de buscas executadas frequentemente
- **Cache de Documentos**: Cache em memória para documentos mais acessados
- **Cache de Índices**: Cache otimizado de índices vetoriais
- **Cache de Resultados**: Cache inteligente de respostas geradas

## 📊 Casos de Uso Empresariais

### Gerenciamento de Conhecimento
- **Wiki Corporativo**: Busca inteligente em bases de conhecimento da empresa
- **Políticas e Procedimentos**: Orientação automatizada de conformidade e procedimentos
- **Materiais de Treinamento**: Assistência inteligente para aprendizado e desenvolvimento
- **Bases de Dados de Pesquisa**: Sistemas de análise de artigos acadêmicos e de pesquisa

### Suporte ao Cliente
- **Base de Conhecimento de Suporte**: Respostas automatizadas para atendimento ao cliente
- **Documentação de Produtos**: Recuperação inteligente de informações sobre produtos
- **Guias de Solução de Problemas**: Assistência contextual para resolução de problemas
- **Sistemas de FAQ**: Geração dinâmica de FAQs a partir de coleções de documentos

### Conformidade Regulamentar
- **Análise de Documentos Jurídicos**: Inteligência em contratos e documentos legais
- **Monitoramento de Conformidade**: Verificação automatizada de conformidade regulatória
- **Avaliação de Riscos**: Análise e relatórios de riscos baseados em documentos
- **Suporte a Auditorias**: Descoberta inteligente de documentos para auditorias

## 🚀 Implantação em Produção

### Monitoramento e Observabilidade
- **Application Insights**: Telemetria detalhada e monitoramento de desempenho
- **Métricas Personalizadas**: Rastreamento e alertas de KPIs específicos de negócios
- **Rastreamento Distribuído**: Rastreamento de solicitações ponta a ponta entre serviços
- **Painéis de Saúde**: Visualização em tempo real da saúde e desempenho do sistema

### Escalabilidade e Confiabilidade
- **Autoescalonamento**: Escalonamento automático com base em carga e métricas de desempenho
- **Alta Disponibilidade**: Implantação em várias regiões com capacidades de failover
- **Teste de Carga**: Validação de desempenho sob condições de carga empresarial
- **Recuperação de Desastres**: Procedimentos automatizados de backup e recuperação

Pronto para construir sistemas RAG de nível empresarial que podem lidar com documentos sensíveis em escala? Vamos arquitetar sistemas inteligentes de conhecimento para empresas! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Aviso Legal**:  
Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.
