# 🔍 Enterprise RAG กับ Azure AI Foundry (.NET)

## 📋 วัตถุประสงค์การเรียนรู้

โน้ตบุ๊กนี้แสดงวิธีการสร้างระบบ Retrieval-Augmented Generation (RAG) ระดับองค์กรโดยใช้ Microsoft Agent Framework ใน .NET กับ Azure AI Foundry คุณจะได้เรียนรู้การสร้างเอเจนต์ที่พร้อมใช้งานในระดับการผลิต ซึ่งสามารถค้นหาเอกสารและให้คำตอบที่แม่นยำและมีบริบท พร้อมด้วยความปลอดภัยและความสามารถในการขยายตัวในระดับองค์กร

**ความสามารถของ Enterprise RAG ที่คุณจะสร้าง:**
- 📚 **Document Intelligence**: การประมวลผลเอกสารขั้นสูงด้วยบริการ Azure AI
- 🔍 **Semantic Search**: การค้นหาเวกเตอร์ประสิทธิภาพสูงพร้อมฟีเจอร์ระดับองค์กร
- 🛡️ **Security Integration**: การเข้าถึงตามบทบาทและรูปแบบการปกป้องข้อมูล
- 🏢 **Scalable Architecture**: ระบบ RAG ที่พร้อมใช้งานในระดับการผลิตพร้อมการตรวจสอบ

## 🎯 สถาปัตยกรรม Enterprise RAG

### องค์ประกอบหลักในระดับองค์กร
- **Azure AI Foundry**: แพลตฟอร์ม AI ระดับองค์กรที่มีการจัดการพร้อมความปลอดภัยและการปฏิบัติตามข้อกำหนด
- **Persistent Agents**: เอเจนต์ที่มีสถานะคงที่พร้อมประวัติการสนทนาและการจัดการบริบท
- **Vector Store Management**: การจัดทำดัชนีเอกสารและการดึงข้อมูลระดับองค์กร
- **Identity Integration**: การรับรองความถูกต้องด้วย Azure AD และการควบคุมการเข้าถึงตามบทบาท

### ประโยชน์ของ .NET ในระดับองค์กร
- **Type Safety**: การตรวจสอบความถูกต้องในเวลาคอมไพล์สำหรับการดำเนินการ RAG และโครงสร้างข้อมูล
- **Async Performance**: การประมวลผลเอกสารและการค้นหาแบบไม่บล็อก
- **Memory Management**: การใช้ทรัพยากรอย่างมีประสิทธิภาพสำหรับคอลเลกชันเอกสารขนาดใหญ่
- **Integration Patterns**: การผสานบริการ Azure แบบเนทีฟด้วย dependency injection

## 🏗️ สถาปัตยกรรมทางเทคนิค

### ท่อส่งข้อมูล Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### องค์ประกอบหลักของ .NET
- **Azure.AI.Agents.Persistent**: การจัดการเอเจนต์ระดับองค์กรพร้อมการคงสถานะ
- **Azure.Identity**: การรับรองความถูกต้องแบบบูรณาการสำหรับการเข้าถึงบริการ Azure อย่างปลอดภัย
- **Microsoft.Agents.AI.AzureAI**: การใช้งานเฟรมเวิร์กเอเจนต์ที่ปรับแต่งสำหรับ Azure
- **System.Linq.Async**: การดำเนินการ LINQ แบบอะซิงโครนัสที่มีประสิทธิภาพสูง

## 🔧 ฟีเจอร์และประโยชน์ในระดับองค์กร

### ความปลอดภัยและการปฏิบัติตามข้อกำหนด
- **Azure AD Integration**: การจัดการตัวตนและการรับรองความถูกต้องในระดับองค์กร
- **Role-Based Access**: การอนุญาตแบบละเอียดสำหรับการเข้าถึงเอกสารและการดำเนินการ
- **Data Protection**: การเข้ารหัสข้อมูลทั้งขณะพักและขณะส่งสำหรับเอกสารที่สำคัญ
- **Audit Logging**: การติดตามกิจกรรมอย่างครอบคลุมสำหรับข้อกำหนดการปฏิบัติตาม

### ประสิทธิภาพและความสามารถในการขยายตัว
- **Connection Pooling**: การจัดการการเชื่อมต่อบริการ Azure อย่างมีประสิทธิภาพ
- **Async Processing**: การดำเนินการแบบไม่บล็อกสำหรับสถานการณ์ที่มีปริมาณงานสูง
- **Caching Strategies**: การแคชอัจฉริยะสำหรับเอกสารที่เข้าถึงบ่อย
- **Load Balancing**: การประมวลผลแบบกระจายสำหรับการใช้งานขนาดใหญ่

### การจัดการและการตรวจสอบ
- **Health Checks**: การตรวจสอบในตัวสำหรับองค์ประกอบระบบ RAG
- **Performance Metrics**: การวิเคราะห์รายละเอียดเกี่ยวกับคุณภาพการค้นหาและเวลาตอบสนอง
- **Error Handling**: การจัดการข้อผิดพลาดอย่างครอบคลุมพร้อมนโยบายการลองใหม่
- **Configuration Management**: การตั้งค่าที่เฉพาะเจาะจงสำหรับแต่ละสภาพแวดล้อมพร้อมการตรวจสอบความถูกต้อง

## ⚙️ ข้อกำหนดเบื้องต้นและการตั้งค่า

**สภาพแวดล้อมการพัฒนา:**
- .NET 9.0 SDK หรือสูงกว่า
- Visual Studio 2022 หรือ VS Code พร้อมส่วนขยาย C#
- การสมัครใช้งาน Azure พร้อมการเข้าถึง AI Foundry

**แพ็กเกจ NuGet ที่จำเป็น:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**การตั้งค่าการรับรองความถูกต้องของ Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**การกำหนดค่าของสภาพแวดล้อม (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 รูปแบบ RAG ในระดับองค์กร

### รูปแบบการจัดการเอกสาร
- **Bulk Upload**: การประมวลผลคอลเลกชันเอกสารขนาดใหญ่ได้อย่างมีประสิทธิภาพ
- **Incremental Updates**: การเพิ่มและแก้ไขเอกสารแบบเรียลไทม์
- **Version Control**: การจัดการเวอร์ชันเอกสารและการติดตามการเปลี่ยนแปลง
- **Metadata Management**: คุณลักษณะเอกสารที่หลากหลายและการจัดหมวดหมู่

### รูปแบบการค้นหาและการดึงข้อมูล
- **Hybrid Search**: การรวมการค้นหาแบบ semantic และ keyword เพื่อผลลัพธ์ที่ดีที่สุด
- **Faceted Search**: การกรองและการจัดหมวดหมู่แบบหลายมิติ
- **Relevance Tuning**: อัลกอริทึมการให้คะแนนแบบกำหนดเองสำหรับความต้องการเฉพาะด้าน
- **Result Ranking**: การจัดอันดับขั้นสูงพร้อมการผสานตรรกะทางธุรกิจ

### รูปแบบความปลอดภัย
- **Document-Level Security**: การควบคุมการเข้าถึงแบบละเอียดสำหรับแต่ละเอกสาร
- **Data Classification**: การติดฉลากความอ่อนไหวและการปกป้องข้อมูลอัตโนมัติ
- **Audit Trails**: การบันทึกการดำเนินการ RAG อย่างครอบคลุม
- **Privacy Protection**: ความสามารถในการตรวจจับและลบข้อมูลส่วนบุคคล (PII)

## 🔒 ฟีเจอร์ความปลอดภัยในระดับองค์กร

### การรับรองความถูกต้องและการอนุญาต
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### การปกป้องข้อมูล
- **Encryption**: การเข้ารหัสแบบ end-to-end สำหรับเอกสารและดัชนีการค้นหา
- **Access Controls**: การผสานกับ Azure AD สำหรับการอนุญาตผู้ใช้และกลุ่ม
- **Data Residency**: การควบคุมตำแหน่งข้อมูลทางภูมิศาสตร์เพื่อการปฏิบัติตามข้อกำหนด
- **Backup & Recovery**: ความสามารถในการสำรองข้อมูลและกู้คืนอัตโนมัติ

## 📈 การปรับปรุงประสิทธิภาพ

### รูปแบบการประมวลผลแบบอะซิงโครนัส
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### การจัดการหน่วยความจำ
- **Streaming Processing**: การจัดการเอกสารขนาดใหญ่โดยไม่เกิดปัญหาหน่วยความจำ
- **Resource Pooling**: การใช้ทรัพยากรที่มีค่าอย่างมีประสิทธิภาพ
- **Garbage Collection**: รูปแบบการจัดสรรหน่วยความจำที่ปรับแต่ง
- **Connection Management**: วงจรการเชื่อมต่อบริการ Azure ที่เหมาะสม

### กลยุทธ์การแคช
- **Query Caching**: การแคชการค้นหาที่ดำเนินการบ่อย
- **Document Caching**: การแคชในหน่วยความจำสำหรับเอกสารที่มีการใช้งานบ่อย
- **Index Caching**: การแคชดัชนีเวกเตอร์ที่ปรับแต่ง
- **Result Caching**: การแคชคำตอบที่สร้างขึ้นอย่างชาญฉลาด

## 📊 กรณีการใช้งานในระดับองค์กร

### การจัดการความรู้
- **Corporate Wiki**: การค้นหาอัจฉริยะในฐานข้อมูลความรู้ของบริษัท
- **Policy & Procedures**: คำแนะนำเกี่ยวกับการปฏิบัติตามข้อกำหนดและขั้นตอนอัตโนมัติ
- **Training Materials**: การช่วยเหลือด้านการเรียนรู้และการพัฒนาที่ชาญฉลาด
- **Research Databases**: ระบบวิเคราะห์เอกสารวิชาการและงานวิจัย

### การสนับสนุนลูกค้า
- **Support Knowledge Base**: การตอบคำถามลูกค้าอัตโนมัติ
- **Product Documentation**: การดึงข้อมูลผลิตภัณฑ์อย่างชาญฉลาด
- **Troubleshooting Guides**: การช่วยแก้ปัญหาเชิงบริบท
- **FAQ Systems**: การสร้าง FAQ แบบไดนามิกจากคอลเลกชันเอกสาร

### การปฏิบัติตามข้อกำหนด
- **Legal Document Analysis**: ความฉลาดในเอกสารสัญญาและกฎหมาย
- **Compliance Monitoring**: การตรวจสอบการปฏิบัติตามข้อกำหนดอัตโนมัติ
- **Risk Assessment**: การวิเคราะห์และรายงานความเสี่ยงจากเอกสาร
- **Audit Support**: การค้นพบเอกสารอัจฉริยะสำหรับการตรวจสอบ

## 🚀 การปรับใช้ในระดับการผลิต

### การตรวจสอบและการสังเกตการณ์
- **Application Insights**: การตรวจสอบรายละเอียดและประสิทธิภาพ
- **Custom Metrics**: การติดตาม KPI เฉพาะธุรกิจและการแจ้งเตือน
- **Distributed Tracing**: การติดตามคำขอแบบ end-to-end ระหว่างบริการ
- **Health Dashboards**: การแสดงภาพสุขภาพและประสิทธิภาพของระบบแบบเรียลไทม์

### ความสามารถในการขยายตัวและความน่าเชื่อถือ
- **Auto-Scaling**: การปรับขนาดอัตโนมัติตามโหลดและเมตริกประสิทธิภาพ
- **High Availability**: การปรับใช้หลายภูมิภาคพร้อมความสามารถในการสำรองข้อมูล
- **Load Testing**: การตรวจสอบประสิทธิภาพภายใต้โหลดระดับองค์กร
- **Disaster Recovery**: ขั้นตอนการสำรองข้อมูลและกู้คืนอัตโนมัติ

พร้อมที่จะสร้างระบบ RAG ระดับองค์กรที่สามารถจัดการเอกสารที่สำคัญในระดับใหญ่ได้แล้วหรือยัง? มาออกแบบระบบความรู้ที่ชาญฉลาดสำหรับองค์กรกันเถอะ! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**ข้อจำกัดความรับผิดชอบ**:  
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI [Co-op Translator](https://github.com/Azure/co-op-translator) แม้ว่าเราจะพยายามให้การแปลมีความถูกต้อง แต่โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาดั้งเดิมควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลภาษามนุษย์ที่มีความเชี่ยวชาญ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดที่เกิดจากการใช้การแปลนี้
