# 🔍 RAG Doanh Nghiệp với Azure AI Foundry (.NET)

## 📋 Mục Tiêu Học Tập

Notebook này hướng dẫn cách xây dựng hệ thống Retrieval-Augmented Generation (RAG) cấp doanh nghiệp bằng Microsoft Agent Framework trong .NET với Azure AI Foundry. Bạn sẽ học cách tạo các agent sẵn sàng cho sản xuất, có khả năng tìm kiếm tài liệu và cung cấp câu trả lời chính xác, phù hợp với ngữ cảnh, đồng thời đảm bảo bảo mật và khả năng mở rộng cho doanh nghiệp.

**Các Tính Năng RAG Doanh Nghiệp Bạn Sẽ Xây Dựng:**
- 📚 **Trí Tuệ Tài Liệu**: Xử lý tài liệu nâng cao với các dịch vụ Azure AI
- 🔍 **Tìm Kiếm Ngữ Nghĩa**: Tìm kiếm vector hiệu suất cao với các tính năng doanh nghiệp
- 🛡️ **Tích Hợp Bảo Mật**: Kiểm soát truy cập dựa trên vai trò và các mẫu bảo vệ dữ liệu
- 🏢 **Kiến Trúc Mở Rộng**: Hệ thống RAG sẵn sàng cho sản xuất với khả năng giám sát

## 🎯 Kiến Trúc RAG Doanh Nghiệp

### Các Thành Phần Cốt Lõi Của Doanh Nghiệp
- **Azure AI Foundry**: Nền tảng AI doanh nghiệp được quản lý với bảo mật và tuân thủ
- **Agent Duy Trì Trạng Thái**: Các agent có trạng thái với lịch sử hội thoại và quản lý ngữ cảnh
- **Quản Lý Vector Store**: Lập chỉ mục và truy xuất tài liệu cấp doanh nghiệp
- **Tích Hợp Danh Tính**: Xác thực Azure AD và kiểm soát truy cập dựa trên vai trò

### Lợi Ích Của .NET Cho Doanh Nghiệp
- **An Toàn Kiểu Dữ Liệu**: Xác thực tại thời điểm biên dịch cho các hoạt động RAG và cấu trúc dữ liệu
- **Hiệu Suất Bất Đồng Bộ**: Xử lý tài liệu và tìm kiếm không chặn
- **Quản Lý Bộ Nhớ**: Sử dụng tài nguyên hiệu quả cho các bộ sưu tập tài liệu lớn
- **Mẫu Tích Hợp**: Tích hợp dịch vụ Azure gốc với dependency injection

## 🏗️ Kiến Trúc Kỹ Thuật

### Quy Trình RAG Doanh Nghiệp
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Các Thành Phần Cốt Lõi Của .NET
- **Azure.AI.Agents.Persistent**: Quản lý agent doanh nghiệp với trạng thái duy trì
- **Azure.Identity**: Xác thực tích hợp để truy cập dịch vụ Azure an toàn
- **Microsoft.Agents.AI.AzureAI**: Triển khai framework agent tối ưu hóa cho Azure
- **System.Linq.Async**: Các hoạt động LINQ bất đồng bộ hiệu suất cao

## 🔧 Tính Năng & Lợi Ích Doanh Nghiệp

### Bảo Mật & Tuân Thủ
- **Tích Hợp Azure AD**: Quản lý danh tính và xác thực doanh nghiệp
- **Kiểm Soát Truy Cập Dựa Trên Vai Trò**: Quyền truy cập chi tiết cho tài liệu và hoạt động
- **Bảo Vệ Dữ Liệu**: Mã hóa khi lưu trữ và khi truyền cho các tài liệu nhạy cảm
- **Ghi Nhật Ký Kiểm Toán**: Theo dõi hoạt động toàn diện để đáp ứng yêu cầu tuân thủ

### Hiệu Suất & Khả Năng Mở Rộng
- **Quản Lý Kết Nối**: Quản lý kết nối dịch vụ Azure hiệu quả
- **Xử Lý Bất Đồng Bộ**: Các hoạt động không chặn cho các tình huống thông lượng cao
- **Chiến Lược Bộ Nhớ Đệm**: Bộ nhớ đệm thông minh cho các tài liệu được truy cập thường xuyên
- **Cân Bằng Tải**: Xử lý phân tán cho các triển khai quy mô lớn

### Quản Lý & Giám Sát
- **Kiểm Tra Sức Khỏe**: Giám sát tích hợp cho các thành phần hệ thống RAG
- **Chỉ Số Hiệu Suất**: Phân tích chi tiết về chất lượng tìm kiếm và thời gian phản hồi
- **Xử Lý Lỗi**: Quản lý ngoại lệ toàn diện với các chính sách thử lại
- **Quản Lý Cấu Hình**: Cài đặt cụ thể theo môi trường với xác thực

## ⚙️ Yêu Cầu & Cài Đặt

**Môi Trường Phát Triển:**
- .NET 9.0 SDK hoặc cao hơn
- Visual Studio 2022 hoặc VS Code với extension C#
- Tài khoản Azure với quyền truy cập AI Foundry

**Các Gói NuGet Cần Thiết:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Cài Đặt Xác Thực Azure:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Cấu Hình Môi Trường (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Mẫu RAG Doanh Nghiệp

### Mẫu Quản Lý Tài Liệu
- **Tải Lên Hàng Loạt**: Xử lý hiệu quả các bộ sưu tập tài liệu lớn
- **Cập Nhật Từng Phần**: Thêm và sửa đổi tài liệu theo thời gian thực
- **Kiểm Soát Phiên Bản**: Quản lý phiên bản và theo dõi thay đổi tài liệu
- **Quản Lý Metadata**: Thuộc tính tài liệu phong phú và phân loại

### Mẫu Tìm Kiếm & Truy Xuất
- **Tìm Kiếm Kết Hợp**: Kết hợp tìm kiếm ngữ nghĩa và từ khóa để đạt kết quả tối ưu
- **Tìm Kiếm Theo Khía Cạnh**: Lọc và phân loại đa chiều
- **Điều Chỉnh Độ Liên Quan**: Thuật toán tính điểm tùy chỉnh cho nhu cầu cụ thể của lĩnh vực
- **Xếp Hạng Kết Quả**: Xếp hạng nâng cao với tích hợp logic kinh doanh

### Mẫu Bảo Mật
- **Bảo Mật Cấp Tài Liệu**: Kiểm soát truy cập chi tiết cho từng tài liệu
- **Phân Loại Dữ Liệu**: Gắn nhãn nhạy cảm tự động và bảo vệ
- **Dấu Vết Kiểm Toán**: Ghi nhật ký toàn diện cho tất cả các hoạt động RAG
- **Bảo Vệ Quyền Riêng Tư**: Khả năng phát hiện và che giấu thông tin cá nhân (PII)

## 🔒 Tính Năng Bảo Mật Doanh Nghiệp

### Xác Thực & Ủy Quyền
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Bảo Vệ Dữ Liệu
- **Mã Hóa**: Mã hóa đầu cuối cho tài liệu và chỉ mục tìm kiếm
- **Kiểm Soát Truy Cập**: Tích hợp với Azure AD cho quyền người dùng và nhóm
- **Cư Trú Dữ Liệu**: Kiểm soát vị trí địa lý của dữ liệu để tuân thủ
- **Sao Lưu & Khôi Phục**: Khả năng sao lưu và khôi phục tự động

## 📈 Tối Ưu Hiệu Suất

### Mẫu Xử Lý Bất Đồng Bộ
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Quản Lý Bộ Nhớ
- **Xử Lý Dòng**: Xử lý tài liệu lớn mà không gặp vấn đề về bộ nhớ
- **Tái Sử Dụng Tài Nguyên**: Sử dụng lại hiệu quả các tài nguyên đắt đỏ
- **Thu Gom Rác**: Mẫu phân bổ bộ nhớ tối ưu
- **Quản Lý Kết Nối**: Vòng đời kết nối dịch vụ Azure hợp lý

### Chiến Lược Bộ Nhớ Đệm
- **Bộ Nhớ Đệm Truy Vấn**: Bộ nhớ đệm các tìm kiếm được thực hiện thường xuyên
- **Bộ Nhớ Đệm Tài Liệu**: Bộ nhớ đệm trong bộ nhớ cho các tài liệu nóng
- **Bộ Nhớ Đệm Chỉ Mục**: Bộ nhớ đệm chỉ mục vector tối ưu
- **Bộ Nhớ Đệm Kết Quả**: Bộ nhớ đệm thông minh cho các câu trả lời được tạo ra

## 📊 Các Trường Hợp Sử Dụng Doanh Nghiệp

### Quản Lý Kiến Thức
- **Wiki Công Ty**: Tìm kiếm thông minh trong các cơ sở kiến thức của công ty
- **Chính Sách & Quy Trình**: Hướng dẫn tuân thủ và quy trình tự động
- **Tài Liệu Đào Tạo**: Hỗ trợ học tập và phát triển thông minh
- **Cơ Sở Dữ Liệu Nghiên Cứu**: Hệ thống phân tích bài báo học thuật và nghiên cứu

### Hỗ Trợ Khách Hàng
- **Cơ Sở Kiến Thức Hỗ Trợ**: Phản hồi dịch vụ khách hàng tự động
- **Tài Liệu Sản Phẩm**: Truy xuất thông tin sản phẩm thông minh
- **Hướng Dẫn Khắc Phục Sự Cố**: Hỗ trợ giải quyết vấn đề theo ngữ cảnh
- **Hệ Thống FAQ**: Tạo FAQ động từ các bộ sưu tập tài liệu

### Tuân Thủ Quy Định
- **Phân Tích Tài Liệu Pháp Lý**: Trí tuệ hợp đồng và tài liệu pháp lý
- **Giám Sát Tuân Thủ**: Kiểm tra tuân thủ quy định tự động
- **Đánh Giá Rủi Ro**: Phân tích và báo cáo rủi ro dựa trên tài liệu
- **Hỗ Trợ Kiểm Toán**: Khám phá tài liệu thông minh cho kiểm toán

## 🚀 Triển Khai Sản Xuất

### Giám Sát & Khả Năng Quan Sát
- **Application Insights**: Giám sát chi tiết và hiệu suất
- **Chỉ Số Tùy Chỉnh**: Theo dõi KPI cụ thể cho doanh nghiệp và cảnh báo
- **Theo Dõi Phân Tán**: Theo dõi yêu cầu từ đầu đến cuối qua các dịch vụ
- **Bảng Điều Khiển Sức Khỏe**: Hình dung sức khỏe và hiệu suất hệ thống theo thời gian thực

### Khả Năng Mở Rộng & Độ Tin Cậy
- **Tự Động Mở Rộng**: Mở rộng tự động dựa trên tải và chỉ số hiệu suất
- **Khả Năng Sẵn Sàng Cao**: Triển khai đa vùng với khả năng chuyển đổi dự phòng
- **Kiểm Tra Tải**: Xác thực hiệu suất dưới điều kiện tải doanh nghiệp
- **Khôi Phục Thảm Họa**: Quy trình sao lưu và khôi phục tự động

Sẵn sàng xây dựng hệ thống RAG cấp doanh nghiệp có thể xử lý tài liệu nhạy cảm ở quy mô lớn? Hãy cùng kiến tạo các hệ thống kiến thức thông minh cho doanh nghiệp! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Tuyên bố miễn trừ trách nhiệm**:  
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp bởi con người. Chúng tôi không chịu trách nhiệm về bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này.
