# 🔍 Enterprise RAG gamit ang Azure AI Foundry (.NET)

## 📋 Mga Layunin sa Pag-aaral

Ang notebook na ito ay nagpapakita kung paano bumuo ng mga enterprise-grade Retrieval-Augmented Generation (RAG) systems gamit ang Microsoft Agent Framework sa .NET kasama ang Azure AI Foundry. Matutunan mong lumikha ng mga production-ready agents na maaaring maghanap sa mga dokumento at magbigay ng tumpak, context-aware na mga sagot na may enterprise security at scalability.

**Mga Kakayahan ng Enterprise RAG na Iyong Mabubuo:**
- 📚 **Intelligence ng Dokumento**: Advanced na pagproseso ng dokumento gamit ang Azure AI services
- 🔍 **Semantic Search**: Mataas na performance na vector search na may enterprise features
- 🛡️ **Integrasyon ng Seguridad**: Role-based access at mga pattern ng proteksyon ng data
- 🏢 **Scalable Architecture**: Production-ready RAG systems na may monitoring

## 🎯 Arkitektura ng Enterprise RAG

### Mga Pangunahing Komponent ng Enterprise
- **Azure AI Foundry**: Managed enterprise AI platform na may seguridad at pagsunod
- **Persistent Agents**: Mga stateful agents na may kasaysayan ng pag-uusap at pamamahala ng konteksto
- **Vector Store Management**: Enterprise-grade na pag-index at retrieval ng dokumento
- **Identity Integration**: Azure AD authentication at role-based access control

### Mga Benepisyo ng .NET para sa Enterprise
- **Type Safety**: Compile-time validation para sa mga operasyon ng RAG at mga istruktura ng data
- **Async Performance**: Non-blocking na pagproseso ng dokumento at mga operasyon sa paghahanap
- **Memory Management**: Mahusay na paggamit ng resources para sa malalaking koleksyon ng dokumento
- **Integration Patterns**: Native na integrasyon ng Azure service gamit ang dependency injection

## 🏗️ Teknikal na Arkitektura

### Pipeline ng Enterprise RAG
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Mga Pangunahing Komponent ng .NET
- **Azure.AI.Agents.Persistent**: Pamamahala ng enterprise agent na may state persistence
- **Azure.Identity**: Integrated authentication para sa secure na access sa Azure services
- **Microsoft.Agents.AI.AzureAI**: Azure-optimized na implementasyon ng agent framework
- **System.Linq.Async**: Mataas na performance na asynchronous LINQ operations

## 🔧 Mga Tampok at Benepisyo ng Enterprise

### Seguridad at Pagsunod
- **Integrasyon ng Azure AD**: Pamamahala ng enterprise identity at authentication
- **Role-Based Access**: Fine-grained na mga pahintulot para sa access sa dokumento at mga operasyon
- **Proteksyon ng Data**: Encryption sa pahinga at sa transit para sa mga sensitibong dokumento
- **Audit Logging**: Komprehensibong pagsubaybay sa aktibidad para sa mga kinakailangan sa pagsunod

### Performance at Scalability
- **Connection Pooling**: Mahusay na pamamahala ng koneksyon sa Azure services
- **Async Processing**: Non-blocking na mga operasyon para sa high-throughput na mga senaryo
- **Caching Strategies**: Matalinong caching para sa madalas na ina-access na mga dokumento
- **Load Balancing**: Distributed processing para sa malakihang deployment

### Pamamahala at Monitoring
- **Health Checks**: Built-in na monitoring para sa mga komponent ng RAG system
- **Performance Metrics**: Detalyadong analytics sa kalidad ng paghahanap at oras ng pagtugon
- **Error Handling**: Komprehensibong pamamahala ng exception na may retry policies
- **Configuration Management**: Mga setting na partikular sa environment na may validation

## ⚙️ Mga Kinakailangan at Setup

**Development Environment:**
- .NET 9.0 SDK o mas mataas
- Visual Studio 2022 o VS Code na may C# extension
- Azure subscription na may access sa AI Foundry

**Mga Kinakailangang NuGet Packages:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Setup ng Azure Authentication:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Configuration ng Environment (.env file):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Mga Pattern ng Enterprise RAG

### Mga Pattern sa Pamamahala ng Dokumento
- **Bulk Upload**: Mahusay na pagproseso ng malalaking koleksyon ng dokumento
- **Incremental Updates**: Real-time na pagdaragdag at pagbabago ng dokumento
- **Version Control**: Pag-version ng dokumento at pagsubaybay sa pagbabago
- **Metadata Management**: Mayamang attributes ng dokumento at taxonomy

### Mga Pattern sa Paghahanap at Retrieval
- **Hybrid Search**: Pagsasama ng semantic at keyword search para sa optimal na resulta
- **Faceted Search**: Multi-dimensional na pag-filter at pag-categorize
- **Relevance Tuning**: Custom na scoring algorithms para sa mga pangangailangan ng domain
- **Result Ranking**: Advanced na ranking na may integrasyon ng business logic

### Mga Pattern sa Seguridad
- **Document-Level Security**: Fine-grained na access control bawat dokumento
- **Data Classification**: Automatic na sensitivity labeling at proteksyon
- **Audit Trails**: Komprehensibong pag-log ng lahat ng operasyon ng RAG
- **Privacy Protection**: Pagtuklas at pag-redact ng PII

## 🔒 Mga Tampok ng Seguridad ng Enterprise

### Authentication at Authorization
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Proteksyon ng Data
- **Encryption**: End-to-end na encryption para sa mga dokumento at search indices
- **Access Controls**: Integrasyon sa Azure AD para sa mga pahintulot ng user at grupo
- **Data Residency**: Mga kontrol sa lokasyon ng data para sa pagsunod
- **Backup at Recovery**: Automated na backup at mga kakayahan sa disaster recovery

## 📈 Pag-optimize ng Performance

### Mga Pattern sa Async Processing
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Pamamahala ng Memory
- **Streaming Processing**: Pagproseso ng malalaking dokumento nang walang isyu sa memory
- **Resource Pooling**: Mahusay na paggamit muli ng mga mahal na resources
- **Garbage Collection**: Na-optimize na mga pattern ng memory allocation
- **Connection Management**: Tamang lifecycle ng koneksyon sa Azure services

### Mga Estratehiya sa Caching
- **Query Caching**: Cache para sa madalas na isinasagawang paghahanap
- **Document Caching**: In-memory caching para sa mga hot documents
- **Index Caching**: Na-optimize na vector index caching
- **Result Caching**: Matalinong caching ng mga generated na sagot

## 📊 Mga Gamit ng Enterprise

### Pamamahala ng Kaalaman
- **Corporate Wiki**: Matalinong paghahanap sa mga knowledge base ng kumpanya
- **Policy at Procedures**: Automated na pagsunod at gabay sa mga pamamaraan
- **Training Materials**: Matalinong tulong sa pag-aaral at pag-unlad
- **Research Databases**: Mga sistema ng pagsusuri ng akademiko at research paper

### Suporta sa Customer
- **Support Knowledge Base**: Automated na mga sagot sa serbisyo sa customer
- **Product Documentation**: Matalinong retrieval ng impormasyon ng produkto
- **Troubleshooting Guides**: Contextual na tulong sa paglutas ng problema
- **FAQ Systems**: Dynamic na pagbuo ng FAQ mula sa mga koleksyon ng dokumento

### Regulatory Compliance
- **Legal Document Analysis**: Intelligence sa kontrata at legal na dokumento
- **Compliance Monitoring**: Automated na pagsuri sa pagsunod sa regulasyon
- **Risk Assessment**: Pagsusuri ng panganib batay sa dokumento at pag-uulat
- **Audit Support**: Matalinong pagdiskubre ng dokumento para sa mga audit

## 🚀 Production Deployment

### Monitoring at Observability
- **Application Insights**: Detalyadong telemetry at monitoring ng performance
- **Custom Metrics**: Pagsubaybay at alerting ng mga KPI na partikular sa negosyo
- **Distributed Tracing**: End-to-end na pagsubaybay sa request sa mga serbisyo
- **Health Dashboards**: Visualization ng real-time na kalusugan ng sistema at performance

### Scalability at Reliability
- **Auto-Scaling**: Automatic na pag-scale batay sa load at performance metrics
- **High Availability**: Multi-region na deployment na may failover capabilities
- **Load Testing**: Pagpapatunay ng performance sa ilalim ng enterprise load conditions
- **Disaster Recovery**: Automated na mga pamamaraan sa backup at recovery

Handa ka na bang bumuo ng mga enterprise-grade RAG systems na kayang magproseso ng sensitibong dokumento sa malakihang sukat? Mag-architect tayo ng matatalinong sistema ng kaalaman para sa enterprise! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Paunawa**:  
Ang dokumentong ito ay isinalin gamit ang AI translation service na [Co-op Translator](https://github.com/Azure/co-op-translator). Bagama't sinisikap naming maging tumpak, pakitandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa kanyang katutubong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na dulot ng paggamit ng pagsasaling ito.
