# üîç RAG aziendale con Microsoft Foundry (.NET)

## üìã Obiettivi di apprendimento

Questo notebook dimostra come costruire sistemi di Generazione Aumentata tramite Recupero (RAG) di livello aziendale usando il Microsoft Agent Framework in .NET con Microsoft Foundry. Imparerai a creare agenti pronti per la produzione che possono cercare nei documenti e fornire risposte accurate e contestuali con sicurezza e scalabilit√† aziendale.

**Capacit√† RAG aziendali che costruirai:**
- üìö **Document Intelligence**: Elaborazione avanzata dei documenti con i servizi Azure AI
- üîç **Ricerca semantica**: Ricerca vettoriale ad alte prestazioni con funzionalit√† enterprise
- üõ°Ô∏è **Integrazione della sicurezza**: Pattern di controllo degli accessi basati sui ruoli e protezione dei dati
- üè¢ **Architettura scalabile**: Sistemi RAG pronti per la produzione con monitoraggio

## üéØ Architettura RAG aziendale

### Componenti aziendali principali
- **Microsoft Foundry**: Piattaforma AI aziendale gestita con sicurezza e conformit√†
- **Persistent Agents**: Agenti con stato, con cronologia delle conversazioni e gestione del contesto
- **Vector Store Management**: Indicizzazione e recupero documentale di livello enterprise
- **Identity Integration**: Autenticazione Azure AD e controllo degli accessi basato sui ruoli

### Vantaggi .NET per le aziende
- **Type Safety**: Validazione a tempo di compilazione per operazioni RAG e strutture dati
- **Async Performance**: Elaborazione non bloccante dei documenti e operazioni di ricerca
- **Memory Management**: Utilizzo efficiente delle risorse per grandi raccolte di documenti
- **Integration Patterns**: Integrazione nativa dei servizi Azure con dependency injection

## üèóÔ∏è Architettura tecnica

### Enterprise RAG Pipeline
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Componenti .NET principali
- **Azure.AI.Agents.Persistent**: Enterprise agent management with state persistence
- **Azure.Identity**: Integrated authentication for secure Azure service access
- **Microsoft.Agents.AI.AzureAI**: Azure-optimized agent framework implementation
- **System.Linq.Async**: High-performance asynchronous LINQ operations

## üîß Funzionalit√† e vantaggi aziendali

### Sicurezza e conformit√†
- **Azure AD Integration**: Gestione dell'identit√† aziendale e autenticazione
- **Role-Based Access**: Permessi di accesso ai documenti e alle operazioni a grana fine
- **Data Protection**: Crittografia a riposo e in transito per documenti sensibili
- **Audit Logging**: Tracciamento completo delle attivit√† per requisiti di conformit√†

### Prestazioni e scalabilit√†
- **Connection Pooling**: Gestione efficiente delle connessioni ai servizi Azure
- **Async Processing**: Operazioni non bloccanti per scenari ad alto throughput
- **Caching Strategies**: Caching intelligente per documenti accessati frequentemente
- **Load Balancing**: Elaborazione distribuita per deployment su larga scala

### Gestione e monitoraggio
- **Health Checks**: Monitoraggio integrato per i componenti del sistema RAG
- **Performance Metrics**: Analitiche dettagliate sulla qualit√† della ricerca e sui tempi di risposta
- **Error Handling**: Gestione completa delle eccezioni con politiche di retry
- **Configuration Management**: Impostazioni specifiche per ambiente con validazione

## ‚öôÔ∏è Prerequisiti e configurazione

**Ambiente di sviluppo:**
- .NET 9.0 SDK o superiore
- Visual Studio 2022 o VS Code con estensione C#
- Sottoscrizione Azure con accesso a AI Foundry

**Pacchetti NuGet richiesti:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configurazione autenticazione Azure:**
```bash
# Installa Azure CLI e autenticati
az login
az account set --subscription "your-subscription-id"
```

**Configurazione dell'ambiente (file .env):**
```env
# Microsoft Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Modelli RAG aziendali

### Modelli di gestione dei documenti
- **Bulk Upload**: Elaborazione efficiente di grandi raccolte di documenti
- **Incremental Updates**: Aggiunta e modifica dei documenti in tempo reale
- **Version Control**: Versioning dei documenti e tracciamento delle modifiche
- **Metadata Management**: Attributi ricchi dei documenti e tassonomia

### Modelli di ricerca e recupero
- **Hybrid Search**: Combinazione di ricerca semantica e per parole chiave per risultati ottimali
- **Faceted Search**: Filtraggio e categorizzazione multidimensionale
- **Relevance Tuning**: Algoritmi di punteggio personalizzati per esigenze specifiche del dominio
- **Result Ranking**: Classifica avanzata con integrazione di logica di business

### Modelli di sicurezza
- **Document-Level Security**: Controllo degli accessi a grana fine per singolo documento
- **Data Classification**: Etichettatura automatica della sensibilit√† e protezione
- **Audit Trails**: Registrazione completa di tutte le operazioni RAG
- **Privacy Protection**: Rilevamento e redazione di PII

## üîí Funzionalit√† di sicurezza aziendale

### Autenticazione e autorizzazione
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protezione dei dati
- **Encryption**: Crittografia end-to-end per documenti e indici di ricerca
- **Access Controls**: Integrazione con Azure AD per permessi di utenti e gruppi
- **Data Residency**: Controlli sulla collocazione geografica dei dati per conformit√†
- **Backup & Recovery**: Capacit√† automatizzate di backup e ripristino in caso di disastro

## üìà Ottimizzazione delle prestazioni

### Pattern di elaborazione asincrona
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gestione della memoria
- **Streaming Processing**: Gestire grandi documenti senza problemi di memoria
- **Resource Pooling**: Riutilizzo efficiente di risorse costose
- **Garbage Collection**: Modelli ottimizzati di allocazione della memoria
- **Connection Management**: Ciclo di vita corretto delle connessioni ai servizi Azure

### Strategie di caching
- **Query Caching**: Caching delle ricerche eseguite frequentemente
- **Document Caching**: Caching in memoria per documenti "hot"
- **Index Caching**: Caching ottimizzato degli indici vettoriali
- **Result Caching**: Caching intelligente delle risposte generate

## üìä Casi d'uso aziendali

### Gestione della conoscenza
- **Corporate Wiki**: Ricerca intelligente attraverso le basi di conoscenza aziendali
- **Policy & Procedures**: Guida automatizzata a conformit√† e procedure
- **Training Materials**: Supporto intelligente per formazione e sviluppo
- **Research Databases**: Sistemi di analisi di paper accademici e di ricerca

### Supporto clienti
- **Support Knowledge Base**: Risposte automatizzate per il servizio clienti
- **Product Documentation**: Recupero intelligente delle informazioni sui prodotti
- **Troubleshooting Guides**: Assistenza contestuale per la risoluzione dei problemi
- **FAQ Systems**: Generazione dinamica di FAQ da collezioni di documenti

### Conformit√† normativa
- **Legal Document Analysis**: Intelligenza per contratti e documenti legali
- **Compliance Monitoring**: Controllo automatizzato della conformit√† normativa
- **Risk Assessment**: Analisi e report sui rischi basati sui documenti
- **Audit Support**: Scoperta intelligente dei documenti per audit

## üöÄ Distribuzione in produzione

### Monitoraggio e osservabilit√†
- **Application Insights**: Telemetria dettagliata e monitoraggio delle prestazioni
- **Custom Metrics**: Tracciamento KPI specifici di business e alerting
- **Distributed Tracing**: Tracciamento end-to-end delle richieste tra i servizi
- **Health Dashboards**: Visualizzazione in tempo reale dello stato e delle prestazioni del sistema

### Scalabilit√† e affidabilit√†
- **Auto-Scaling**: Scalabilit√† automatica basata su carico e metriche di prestazione
- **High Availability**: Deployment multi-regione con capacit√† di failover
- **Load Testing**: Validazione delle prestazioni sotto carico enterprise
- **Disaster Recovery**: Procedure automatizzate di backup e ripristino

Pronto a costruire sistemi RAG di livello aziendale in grado di gestire documenti sensibili su larga scala? Progettiamo sistemi di conoscenza intelligenti per l'impresa! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**Esclusione di responsabilit√†**:
Questo documento √® stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Pur impegnandoci per l'accuratezza, si tenga presente che le traduzioni automatiche possono contenere errori o inesattezze. Il documento originale nella sua lingua di origine deve essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali fraintendimenti o interpretazioni errate derivanti dall'uso di questa traduzione.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
