# üîç RAG d'entreprise avec Azure AI Foundry (.NET)

## üìã Objectifs d'apprentissage

Ce notebook montre comment cr√©er des syst√®mes RAG (Retrieval-Augmented Generation) de niveau entreprise en utilisant le Microsoft Agent Framework en .NET avec Azure AI Foundry. Vous apprendrez √† concevoir des agents pr√™ts pour la production capables de rechercher dans des documents et de fournir des r√©ponses pr√©cises et contextuelles, tout en garantissant la s√©curit√© et la scalabilit√© propres aux entreprises.

**Fonctionnalit√©s RAG d'entreprise que vous allez d√©velopper :**
- üìö **Intelligence documentaire** : Traitement avanc√© des documents avec les services Azure AI
- üîç **Recherche s√©mantique** : Recherche vectorielle haute performance avec des fonctionnalit√©s d'entreprise
- üõ°Ô∏è **Int√©gration de la s√©curit√©** : Contr√¥le d'acc√®s bas√© sur les r√¥les et mod√®les de protection des donn√©es
- üè¢ **Architecture √©volutive** : Syst√®mes RAG pr√™ts pour la production avec surveillance int√©gr√©e

## üéØ Architecture RAG d'entreprise

### Composants principaux d'entreprise
- **Azure AI Foundry** : Plateforme AI g√©r√©e pour les entreprises avec s√©curit√© et conformit√©
- **Agents persistants** : Agents avec gestion de l'historique des conversations et du contexte
- **Gestion des magasins vectoriels** : Indexation et r√©cup√©ration de documents de niveau entreprise
- **Int√©gration d'identit√©** : Authentification Azure AD et contr√¥le d'acc√®s bas√© sur les r√¥les

### Avantages de .NET pour les entreprises
- **S√©curit√© des types** : Validation au moment de la compilation pour les op√©rations RAG et les structures de donn√©es
- **Performance asynchrone** : Traitement non bloquant des documents et des op√©rations de recherche
- **Gestion de la m√©moire** : Utilisation efficace des ressources pour les grandes collections de documents
- **Mod√®les d'int√©gration** : Int√©gration native des services Azure avec injection de d√©pendances

## üèóÔ∏è Architecture technique

### Pipeline RAG d'entreprise
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Composants principaux de .NET
- **Azure.AI.Agents.Persistent** : Gestion des agents d'entreprise avec persistance de l'√©tat
- **Azure.Identity** : Authentification int√©gr√©e pour un acc√®s s√©curis√© aux services Azure
- **Microsoft.Agents.AI.AzureAI** : Impl√©mentation du framework d'agents optimis√© pour Azure
- **System.Linq.Async** : Op√©rations LINQ asynchrones haute performance

## üîß Fonctionnalit√©s et avantages d'entreprise

### S√©curit√© et conformit√©
- **Int√©gration Azure AD** : Gestion des identit√©s et authentification d'entreprise
- **Acc√®s bas√© sur les r√¥les** : Permissions granulaires pour l'acc√®s aux documents et aux op√©rations
- **Protection des donn√©es** : Cryptage des donn√©es au repos et en transit pour les documents sensibles
- **Journalisation des audits** : Suivi complet des activit√©s pour r√©pondre aux exigences de conformit√©

### Performance et scalabilit√©
- **Pooling de connexions** : Gestion efficace des connexions aux services Azure
- **Traitement asynchrone** : Op√©rations non bloquantes pour des sc√©narios √† haut d√©bit
- **Strat√©gies de mise en cache** : Mise en cache intelligente pour les documents fr√©quemment consult√©s
- **R√©partition de charge** : Traitement distribu√© pour les d√©ploiements √† grande √©chelle

### Gestion et surveillance
- **V√©rifications de sant√©** : Surveillance int√©gr√©e des composants du syst√®me RAG
- **M√©triques de performance** : Analyses d√©taill√©es sur la qualit√© des recherches et les temps de r√©ponse
- **Gestion des erreurs** : Gestion compl√®te des exceptions avec des politiques de reprise
- **Gestion de la configuration** : Param√®tres sp√©cifiques √† l'environnement avec validation

## ‚öôÔ∏è Pr√©requis et configuration

**Environnement de d√©veloppement :**
- SDK .NET 9.0 ou sup√©rieur
- Visual Studio 2022 ou VS Code avec extension C#
- Abonnement Azure avec acc√®s √† AI Foundry

**Packages NuGet requis :**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configuration d'authentification Azure :**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuration de l'environnement (.env file) :**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Mod√®les RAG d'entreprise

### Mod√®les de gestion des documents
- **T√©l√©chargement en masse** : Traitement efficace de grandes collections de documents
- **Mises √† jour incr√©mentielles** : Ajout et modification de documents en temps r√©el
- **Contr√¥le de version** : Gestion des versions et suivi des modifications des documents
- **Gestion des m√©tadonn√©es** : Attributs riches et taxonomie des documents

### Mod√®les de recherche et de r√©cup√©ration
- **Recherche hybride** : Combinaison de recherche s√©mantique et par mots-cl√©s pour des r√©sultats optimaux
- **Recherche facett√©e** : Filtrage multidimensionnel et cat√©gorisation
- **Ajustement de pertinence** : Algorithmes de scoring personnalis√©s pour des besoins sp√©cifiques au domaine
- **Classement des r√©sultats** : Classement avanc√© avec int√©gration de logique m√©tier

### Mod√®les de s√©curit√©
- **S√©curit√© au niveau des documents** : Contr√¥le d'acc√®s granulaire par document
- **Classification des donn√©es** : √âtiquetage automatique de sensibilit√© et protection
- **Trails d'audit** : Journalisation compl√®te de toutes les op√©rations RAG
- **Protection de la vie priv√©e** : D√©tection et masquage des informations personnelles identifiables (PII)

## üîí Fonctionnalit√©s de s√©curit√© d'entreprise

### Authentification et autorisation
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protection des donn√©es
- **Cryptage** : Cryptage de bout en bout pour les documents et les indices de recherche
- **Contr√¥les d'acc√®s** : Int√©gration avec Azure AD pour les permissions utilisateur et groupe
- **R√©sidence des donn√©es** : Contr√¥les de localisation g√©ographique des donn√©es pour la conformit√©
- **Sauvegarde et r√©cup√©ration** : Sauvegarde automatis√©e et capacit√©s de r√©cup√©ration en cas de sinistre

## üìà Optimisation des performances

### Mod√®les de traitement asynchrone
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gestion de la m√©moire
- **Traitement en streaming** : Gestion des grands documents sans probl√®mes de m√©moire
- **Pooling des ressources** : R√©utilisation efficace des ressources co√ªteuses
- **Collecte des d√©chets** : Mod√®les optimis√©s d'allocation de m√©moire
- **Gestion des connexions** : Cycle de vie appropri√© des connexions aux services Azure

### Strat√©gies de mise en cache
- **Mise en cache des requ√™tes** : Mise en cache des recherches fr√©quemment ex√©cut√©es
- **Mise en cache des documents** : Mise en cache en m√©moire pour les documents populaires
- **Mise en cache des indices** : Optimisation de la mise en cache des indices vectoriels
- **Mise en cache des r√©sultats** : Mise en cache intelligente des r√©ponses g√©n√©r√©es

## üìä Cas d'utilisation d'entreprise

### Gestion des connaissances
- **Wiki d'entreprise** : Recherche intelligente dans les bases de connaissances de l'entreprise
- **Politiques et proc√©dures** : Assistance automatis√©e pour la conformit√© et les proc√©dures
- **Mat√©riaux de formation** : Assistance intelligente pour l'apprentissage et le d√©veloppement
- **Bases de donn√©es de recherche** : Syst√®mes d'analyse de documents acad√©miques et de recherche

### Support client
- **Base de connaissances de support** : R√©ponses automatis√©es pour le service client
- **Documentation produit** : Recherche intelligente d'informations sur les produits
- **Guides de d√©pannage** : Assistance contextuelle pour r√©soudre les probl√®mes
- **Syst√®mes de FAQ** : G√©n√©ration dynamique de FAQ √† partir de collections de documents

### Conformit√© r√©glementaire
- **Analyse de documents juridiques** : Intelligence pour les contrats et documents juridiques
- **Surveillance de la conformit√©** : V√©rification automatis√©e de la conformit√© r√©glementaire
- **√âvaluation des risques** : Analyse et reporting des risques bas√©s sur les documents
- **Support d'audit** : D√©couverte intelligente de documents pour les audits

## üöÄ D√©ploiement en production

### Surveillance et observabilit√©
- **Application Insights** : T√©l√©metrie d√©taill√©e et surveillance des performances
- **M√©triques personnalis√©es** : Suivi et alertes des indicateurs cl√©s de performance sp√©cifiques √† l'entreprise
- **Tra√ßage distribu√©** : Suivi de bout en bout des requ√™tes √† travers les services
- **Tableaux de bord de sant√©** : Visualisation en temps r√©el de la sant√© et des performances du syst√®me

### Scalabilit√© et fiabilit√©
- **Auto-scaling** : Scalabilit√© automatique bas√©e sur la charge et les m√©triques de performance
- **Haute disponibilit√©** : D√©ploiement multi-r√©gions avec capacit√©s de basculement
- **Tests de charge** : Validation des performances sous des conditions de charge d'entreprise
- **R√©cup√©ration apr√®s sinistre** : Proc√©dures automatis√©es de sauvegarde et de r√©cup√©ration

Pr√™t √† concevoir des syst√®mes RAG de niveau entreprise capables de g√©rer des documents sensibles √† grande √©chelle ? Construisons des syst√®mes de connaissances intelligents pour les entreprises ! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.



---

**Avertissement** :  
Ce document a √©t√© traduit √† l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatis√©es peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit √™tre consid√©r√© comme la source faisant autorit√©. Pour des informations critiques, il est recommand√© de recourir √† une traduction humaine professionnelle. Nous d√©clinons toute responsabilit√© en cas de malentendus ou d'interpr√©tations erron√©es r√©sultant de l'utilisation de cette traduction.
