# 🔍 एंटरप्राइज RAG विथ Azure AI Foundry (.NET)

## 📋 सीखने के उद्देश्य

यह नोटबुक Microsoft Agent Framework का उपयोग करके .NET और Azure AI Foundry के साथ एंटरप्राइज-ग्रेड Retrieval-Augmented Generation (RAG) सिस्टम बनाने का तरीका दिखाती है। आप प्रोडक्शन-रेडी एजेंट बनाना सीखेंगे जो दस्तावेज़ों को खोज सकते हैं और सटीक, संदर्भ-संवेदनशील उत्तर प्रदान कर सकते हैं, साथ ही एंटरप्राइज सुरक्षा और स्केलेबिलिटी सुनिश्चित कर सकते हैं।

**एंटरप्राइज RAG क्षमताएं जो आप बनाएंगे:**
- 📚 **डॉक्यूमेंट इंटेलिजेंस**: Azure AI सेवाओं के साथ उन्नत दस्तावेज़ प्रसंस्करण
- 🔍 **सिमेंटिक सर्च**: एंटरप्राइज फीचर्स के साथ उच्च-प्रदर्शन वेक्टर सर्च
- 🛡️ **सुरक्षा एकीकरण**: रोल-आधारित एक्सेस और डेटा सुरक्षा पैटर्न
- 🏢 **स्केलेबल आर्किटेक्चर**: मॉनिटरिंग के साथ प्रोडक्शन-रेडी RAG सिस्टम

## 🎯 एंटरप्राइज RAG आर्किटेक्चर

### मुख्य एंटरप्राइज घटक
- **Azure AI Foundry**: सुरक्षा और अनुपालन के साथ प्रबंधित एंटरप्राइज AI प्लेटफ़ॉर्म
- **Persistent Agents**: स्टेटफुल एजेंट्स जो वार्तालाप इतिहास और संदर्भ प्रबंधन के साथ आते हैं
- **Vector Store Management**: एंटरप्राइज-ग्रेड दस्तावेज़ इंडेक्सिंग और पुनर्प्राप्ति
- **Identity Integration**: Azure AD प्रमाणीकरण और रोल-आधारित एक्सेस नियंत्रण

### .NET एंटरप्राइज लाभ
- **टाइप सेफ्टी**: RAG ऑपरेशन्स और डेटा संरचनाओं के लिए कंपाइल-टाइम वैलिडेशन
- **Async परफॉर्मेंस**: नॉन-ब्लॉकिंग दस्तावेज़ प्रसंस्करण और खोज संचालन
- **मेमोरी प्रबंधन**: बड़े दस्तावेज़ संग्रह के लिए कुशल संसाधन उपयोग
- **इंटीग्रेशन पैटर्न**: डिपेंडेंसी इंजेक्शन के साथ नेटिव Azure सेवा एकीकरण

## 🏗️ तकनीकी आर्किटेक्चर

### एंटरप्राइज RAG पाइपलाइन
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### मुख्य .NET घटक
- **Azure.AI.Agents.Persistent**: स्टेट पर्सिस्टेंस के साथ एंटरप्राइज एजेंट प्रबंधन
- **Azure.Identity**: सुरक्षित Azure सेवा एक्सेस के लिए एकीकृत प्रमाणीकरण
- **Microsoft.Agents.AI.AzureAI**: Azure-ऑप्टिमाइज़्ड एजेंट फ्रेमवर्क कार्यान्वयन
- **System.Linq.Async**: उच्च-प्रदर्शन असिंक्रोनस LINQ संचालन

## 🔧 एंटरप्राइज फीचर्स और लाभ

### सुरक्षा और अनुपालन
- **Azure AD एकीकरण**: एंटरप्राइज पहचान प्रबंधन और प्रमाणीकरण
- **रोल-आधारित एक्सेस**: दस्तावेज़ एक्सेस और संचालन के लिए फाइन-ग्रेन परमिशन
- **डेटा सुरक्षा**: संवेदनशील दस्तावेज़ों के लिए एन्क्रिप्शन एट रेस्ट और इन ट्रांजिट
- **ऑडिट लॉगिंग**: अनुपालन आवश्यकताओं के लिए व्यापक गतिविधि ट्रैकिंग

### प्रदर्शन और स्केलेबिलिटी
- **कनेक्शन पूलिंग**: कुशल Azure सेवा कनेक्शन प्रबंधन
- **Async प्रोसेसिंग**: उच्च-थ्रूपुट परिदृश्यों के लिए नॉन-ब्लॉकिंग संचालन
- **कैशिंग रणनीतियां**: बार-बार एक्सेस किए गए दस्तावेज़ों के लिए इंटेलिजेंट कैशिंग
- **लोड बैलेंसिंग**: बड़े पैमाने पर डिप्लॉयमेंट के लिए वितरित प्रसंस्करण

### प्रबंधन और मॉनिटरिंग
- **हेल्थ चेक्स**: RAG सिस्टम घटकों के लिए बिल्ट-इन मॉनिटरिंग
- **परफॉर्मेंस मेट्रिक्स**: खोज गुणवत्ता और प्रतिक्रिया समय पर विस्तृत एनालिटिक्स
- **एरर हैंडलिंग**: रिट्राई पॉलिसी के साथ व्यापक अपवाद प्रबंधन
- **कॉन्फ़िगरेशन प्रबंधन**: वैलिडेशन के साथ पर्यावरण-विशिष्ट सेटिंग्स

## ⚙️ आवश्यकताएं और सेटअप

**डेवलपमेंट एनवायरनमेंट:**
- .NET 9.0 SDK या उच्चतर
- Visual Studio 2022 या VS Code C# एक्सटेंशन के साथ
- Azure सब्सक्रिप्शन जिसमें AI Foundry एक्सेस हो

**आवश्यक NuGet पैकेज:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure प्रमाणीकरण सेटअप:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**पर्यावरण कॉन्फ़िगरेशन (.env फ़ाइल):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 एंटरप्राइज RAG पैटर्न

### दस्तावेज़ प्रबंधन पैटर्न
- **बल्क अपलोड**: बड़े दस्तावेज़ संग्रह का कुशल प्रसंस्करण
- **इंक्रिमेंटल अपडेट्स**: वास्तविक समय में दस्तावेज़ जोड़ना और संशोधन
- **वर्जन कंट्रोल**: दस्तावेज़ संस्करण और परिवर्तन ट्रैकिंग
- **मेटाडेटा प्रबंधन**: समृद्ध दस्तावेज़ विशेषताएं और वर्गीकरण

### खोज और पुनर्प्राप्ति पैटर्न
- **हाइब्रिड सर्च**: इष्टतम परिणामों के लिए सिमेंटिक और कीवर्ड सर्च का संयोजन
- **फैसेटेड सर्च**: बहु-आयामी फ़िल्टरिंग और वर्गीकरण
- **प्रासंगिकता ट्यूनिंग**: डोमेन-विशिष्ट आवश्यकताओं के लिए कस्टम स्कोरिंग एल्गोरिदम
- **रिजल्ट रैंकिंग**: बिजनेस लॉजिक इंटीग्रेशन के साथ उन्नत रैंकिंग

### सुरक्षा पैटर्न
- **दस्तावेज़-स्तरीय सुरक्षा**: प्रत्येक दस्तावेज़ के लिए फाइन-ग्रेन एक्सेस नियंत्रण
- **डेटा वर्गीकरण**: स्वचालित संवेदनशीलता लेबलिंग और सुरक्षा
- **ऑडिट ट्रेल्स**: सभी RAG संचालन का व्यापक लॉगिंग
- **गोपनीयता सुरक्षा**: PII डिटेक्शन और रिडैक्शन क्षमताएं

## 🔒 एंटरप्राइज सुरक्षा फीचर्स

### प्रमाणीकरण और प्राधिकरण
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### डेटा सुरक्षा
- **एन्क्रिप्शन**: दस्तावेज़ों और सर्च इंडेक्स के लिए एंड-टू-एंड एन्क्रिप्शन
- **एक्सेस कंट्रोल्स**: उपयोगकर्ता और समूह अनुमतियों के लिए Azure AD के साथ एकीकरण
- **डेटा रेजिडेंसी**: अनुपालन के लिए भौगोलिक डेटा स्थान नियंत्रण
- **बैकअप और रिकवरी**: स्वचालित बैकअप और आपदा पुनर्प्राप्ति क्षमताएं

## 📈 प्रदर्शन अनुकूलन

### Async प्रोसेसिंग पैटर्न
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### मेमोरी प्रबंधन
- **स्ट्रीमिंग प्रोसेसिंग**: बड़े दस्तावेज़ों को बिना मेमोरी समस्याओं के संभालना
- **रिसोर्स पूलिंग**: महंगे संसाधनों का कुशल पुन: उपयोग
- **गार्बेज कलेक्शन**: अनुकूलित मेमोरी आवंटन पैटर्न
- **कनेक्शन प्रबंधन**: उचित Azure सेवा कनेक्शन जीवनचक्र

### कैशिंग रणनीतियां
- **क्वेरी कैशिंग**: बार-बार निष्पादित खोजों को कैश करना
- **दस्तावेज़ कैशिंग**: हॉट दस्तावेज़ों के लिए इन-मेमोरी कैशिंग
- **इंडेक्स कैशिंग**: अनुकूलित वेक्टर इंडेक्स कैशिंग
- **रिजल्ट कैशिंग**: उत्पन्न उत्तरों की इंटेलिजेंट कैशिंग

## 📊 एंटरप्राइज उपयोग के मामले

### नॉलेज मैनेजमेंट
- **कॉर्पोरेट विकी**: कंपनी के नॉलेज बेस में इंटेलिजेंट सर्च
- **पॉलिसी और प्रक्रियाएं**: स्वचालित अनुपालन और प्रक्रिया मार्गदर्शन
- **प्रशिक्षण सामग्री**: इंटेलिजेंट लर्निंग और विकास सहायता
- **शोध डेटाबेस**: शैक्षणिक और शोध पत्र विश्लेषण प्रणाली

### ग्राहक सहायता
- **सपोर्ट नॉलेज बेस**: स्वचालित ग्राहक सेवा उत्तर
- **उत्पाद दस्तावेज़ीकरण**: इंटेलिजेंट उत्पाद जानकारी पुनर्प्राप्ति
- **समस्या निवारण गाइड**: संदर्भ-आधारित समस्या समाधान सहायता
- **FAQ सिस्टम**: दस्तावेज़ संग्रह से डायनामिक FAQ निर्माण

### नियामक अनुपालन
- **कानूनी दस्तावेज़ विश्लेषण**: अनुबंध और कानूनी दस्तावेज़ इंटेलिजेंस
- **अनुपालन मॉनिटरिंग**: स्वचालित नियामक अनुपालन जांच
- **जोखिम मूल्यांकन**: दस्तावेज़-आधारित जोखिम विश्लेषण और रिपोर्टिंग
- **ऑडिट समर्थन**: ऑडिट के लिए इंटेलिजेंट दस्तावेज़ खोज

## 🚀 प्रोडक्शन डिप्लॉयमेंट

### मॉनिटरिंग और अवलोकन
- **एप्लिकेशन इनसाइट्स**: विस्तृत टेलीमेट्री और प्रदर्शन मॉनिटरिंग
- **कस्टम मेट्रिक्स**: बिजनेस-विशिष्ट KPI ट्रैकिंग और अलर्टिंग
- **डिस्ट्रिब्यूटेड ट्रेसिंग**: सेवाओं के बीच एंड-टू-एंड अनुरोध ट्रैकिंग
- **हेल्थ डैशबोर्ड्स**: वास्तविक समय में सिस्टम स्वास्थ्य और प्रदर्शन विज़ुअलाइज़ेशन

### स्केलेबिलिटी और विश्वसनीयता
- **ऑटो-स्केलिंग**: लोड और प्रदर्शन मेट्रिक्स के आधार पर स्वचालित स्केलिंग
- **हाई अवेलेबिलिटी**: मल्टी-रीजन डिप्लॉयमेंट विथ फेलओवर क्षमताएं
- **लोड टेस्टिंग**: एंटरप्राइज लोड कंडीशंस के तहत प्रदर्शन सत्यापन
- **डिजास्टर रिकवरी**: स्वचालित बैकअप और रिकवरी प्रक्रियाएं

क्या आप एंटरप्राइज-ग्रेड RAG सिस्टम बनाने के लिए तैयार हैं जो संवेदनशील दस्तावेज़ों को बड़े पैमाने पर संभाल सके? चलिए एंटरप्राइज के लिए इंटेलिजेंट नॉलेज सिस्टम आर्किटेक्ट करते हैं! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**अस्वीकरण**:  
यह दस्तावेज़ AI अनुवाद सेवा [Co-op Translator](https://github.com/Azure/co-op-translator) का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।
