# 🔍 RAG d'entreprise avec Azure AI Foundry (.NET)

## 📋 Objectifs d'apprentissage

Ce notebook montre comment créer des systèmes RAG (Retrieval-Augmented Generation) de niveau entreprise en utilisant le Microsoft Agent Framework en .NET avec Azure AI Foundry. Vous apprendrez à concevoir des agents prêts pour la production capables de rechercher dans des documents et de fournir des réponses précises et contextuelles, tout en garantissant la sécurité et la scalabilité propres aux entreprises.

**Fonctionnalités RAG d'entreprise que vous allez développer :**
- 📚 **Intelligence documentaire** : Traitement avancé des documents avec les services Azure AI
- 🔍 **Recherche sémantique** : Recherche vectorielle haute performance avec des fonctionnalités d'entreprise
- 🛡️ **Intégration de la sécurité** : Contrôle d'accès basé sur les rôles et modèles de protection des données
- 🏢 **Architecture évolutive** : Systèmes RAG prêts pour la production avec surveillance intégrée

## 🎯 Architecture RAG d'entreprise

### Composants principaux d'entreprise
- **Azure AI Foundry** : Plateforme AI gérée pour les entreprises avec sécurité et conformité
- **Agents persistants** : Agents avec gestion de l'historique des conversations et du contexte
- **Gestion des magasins vectoriels** : Indexation et récupération de documents de niveau entreprise
- **Intégration d'identité** : Authentification Azure AD et contrôle d'accès basé sur les rôles

### Avantages de .NET pour les entreprises
- **Sécurité des types** : Validation au moment de la compilation pour les opérations RAG et les structures de données
- **Performance asynchrone** : Traitement non bloquant des documents et des opérations de recherche
- **Gestion de la mémoire** : Utilisation efficace des ressources pour les grandes collections de documents
- **Modèles d'intégration** : Intégration native des services Azure avec injection de dépendances

## 🏗️ Architecture technique

### Pipeline RAG d'entreprise
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Composants principaux de .NET
- **Azure.AI.Agents.Persistent** : Gestion des agents d'entreprise avec persistance de l'état
- **Azure.Identity** : Authentification intégrée pour un accès sécurisé aux services Azure
- **Microsoft.Agents.AI.AzureAI** : Implémentation du framework d'agents optimisé pour Azure
- **System.Linq.Async** : Opérations LINQ asynchrones haute performance

## 🔧 Fonctionnalités et avantages d'entreprise

### Sécurité et conformité
- **Intégration Azure AD** : Gestion des identités et authentification d'entreprise
- **Accès basé sur les rôles** : Permissions granulaires pour l'accès aux documents et aux opérations
- **Protection des données** : Cryptage des données au repos et en transit pour les documents sensibles
- **Journalisation des audits** : Suivi complet des activités pour répondre aux exigences de conformité

### Performance et scalabilité
- **Pooling de connexions** : Gestion efficace des connexions aux services Azure
- **Traitement asynchrone** : Opérations non bloquantes pour des scénarios à haut débit
- **Stratégies de mise en cache** : Mise en cache intelligente pour les documents fréquemment consultés
- **Répartition de charge** : Traitement distribué pour les déploiements à grande échelle

### Gestion et surveillance
- **Vérifications de santé** : Surveillance intégrée des composants du système RAG
- **Métriques de performance** : Analyses détaillées sur la qualité des recherches et les temps de réponse
- **Gestion des erreurs** : Gestion complète des exceptions avec des politiques de reprise
- **Gestion de la configuration** : Paramètres spécifiques à l'environnement avec validation

## ⚙️ Prérequis et configuration

**Environnement de développement :**
- SDK .NET 9.0 ou supérieur
- Visual Studio 2022 ou VS Code avec extension C#
- Abonnement Azure avec accès à AI Foundry

**Packages NuGet requis :**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Configuration d'authentification Azure :**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuration de l'environnement (.env file) :**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Modèles RAG d'entreprise

### Modèles de gestion des documents
- **Téléchargement en masse** : Traitement efficace de grandes collections de documents
- **Mises à jour incrémentielles** : Ajout et modification de documents en temps réel
- **Contrôle de version** : Gestion des versions et suivi des modifications des documents
- **Gestion des métadonnées** : Attributs riches et taxonomie des documents

### Modèles de recherche et de récupération
- **Recherche hybride** : Combinaison de recherche sémantique et par mots-clés pour des résultats optimaux
- **Recherche facettée** : Filtrage multidimensionnel et catégorisation
- **Ajustement de pertinence** : Algorithmes de scoring personnalisés pour des besoins spécifiques au domaine
- **Classement des résultats** : Classement avancé avec intégration de logique métier

### Modèles de sécurité
- **Sécurité au niveau des documents** : Contrôle d'accès granulaire par document
- **Classification des données** : Étiquetage automatique de sensibilité et protection
- **Trails d'audit** : Journalisation complète de toutes les opérations RAG
- **Protection de la vie privée** : Détection et masquage des informations personnelles identifiables (PII)

## 🔒 Fonctionnalités de sécurité d'entreprise

### Authentification et autorisation
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Protection des données
- **Cryptage** : Cryptage de bout en bout pour les documents et les indices de recherche
- **Contrôles d'accès** : Intégration avec Azure AD pour les permissions utilisateur et groupe
- **Résidence des données** : Contrôles de localisation géographique des données pour la conformité
- **Sauvegarde et récupération** : Sauvegarde automatisée et capacités de récupération en cas de sinistre

## 📈 Optimisation des performances

### Modèles de traitement asynchrone
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Gestion de la mémoire
- **Traitement en streaming** : Gestion des grands documents sans problèmes de mémoire
- **Pooling des ressources** : Réutilisation efficace des ressources coûteuses
- **Collecte des déchets** : Modèles optimisés d'allocation de mémoire
- **Gestion des connexions** : Cycle de vie approprié des connexions aux services Azure

### Stratégies de mise en cache
- **Mise en cache des requêtes** : Mise en cache des recherches fréquemment exécutées
- **Mise en cache des documents** : Mise en cache en mémoire pour les documents populaires
- **Mise en cache des indices** : Optimisation de la mise en cache des indices vectoriels
- **Mise en cache des résultats** : Mise en cache intelligente des réponses générées

## 📊 Cas d'utilisation d'entreprise

### Gestion des connaissances
- **Wiki d'entreprise** : Recherche intelligente dans les bases de connaissances de l'entreprise
- **Politiques et procédures** : Assistance automatisée pour la conformité et les procédures
- **Matériaux de formation** : Assistance intelligente pour l'apprentissage et le développement
- **Bases de données de recherche** : Systèmes d'analyse de documents académiques et de recherche

### Support client
- **Base de connaissances de support** : Réponses automatisées pour le service client
- **Documentation produit** : Recherche intelligente d'informations sur les produits
- **Guides de dépannage** : Assistance contextuelle pour résoudre les problèmes
- **Systèmes de FAQ** : Génération dynamique de FAQ à partir de collections de documents

### Conformité réglementaire
- **Analyse de documents juridiques** : Intelligence pour les contrats et documents juridiques
- **Surveillance de la conformité** : Vérification automatisée de la conformité réglementaire
- **Évaluation des risques** : Analyse et reporting des risques basés sur les documents
- **Support d'audit** : Découverte intelligente de documents pour les audits

## 🚀 Déploiement en production

### Surveillance et observabilité
- **Application Insights** : Télémetrie détaillée et surveillance des performances
- **Métriques personnalisées** : Suivi et alertes des indicateurs clés de performance spécifiques à l'entreprise
- **Traçage distribué** : Suivi de bout en bout des requêtes à travers les services
- **Tableaux de bord de santé** : Visualisation en temps réel de la santé et des performances du système

### Scalabilité et fiabilité
- **Auto-scaling** : Scalabilité automatique basée sur la charge et les métriques de performance
- **Haute disponibilité** : Déploiement multi-régions avec capacités de basculement
- **Tests de charge** : Validation des performances sous des conditions de charge d'entreprise
- **Récupération après sinistre** : Procédures automatisées de sauvegarde et de récupération

Prêt à concevoir des systèmes RAG de niveau entreprise capables de gérer des documents sensibles à grande échelle ? Construisons des systèmes de connaissances intelligents pour les entreprises ! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Avertissement** :  
Ce document a été traduit à l'aide du service de traduction automatique [Co-op Translator](https://github.com/Azure/co-op-translator). Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de recourir à une traduction humaine professionnelle. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.
