# üîç Enterprise RAG with Microsoft Foundry (.NET)

## üìã Mga Layunin sa Pagkatuto

Ipinapakita ng notebook na ito kung paano bumuo ng enterprise-grade Retrieval-Augmented Generation (RAG) systems gamit ang Microsoft Agent Framework sa .NET kasama ang Microsoft Foundry. Matututuhan mong gumawa ng production-ready na mga agent na makakapaghanap sa mga dokumento at makapagbibigay ng tumpak, may kamalayang konteksto na mga tugon na may enterprise na seguridad at scalability.

**Mga Kakayahan ng Enterprise RAG na iyong Bubuoin:**
- üìö **Intelihensiya ng Dokumento**: Advanced na pagproseso ng dokumento gamit ang mga serbisyo ng Azure AI
- üîç **Semantikong Paghahanap**: Mataas na pagganap na vector search na may mga enterprise na tampok
- üõ°Ô∏è **Integrasyon ng Seguridad**: Role-based access at mga pattern ng proteksyon ng datos
- üè¢ **Nasusukat na Arkitektura**: Production-ready na mga RAG system na may monitoring

## üéØ Arkitektura ng Enterprise RAG

### Pangunahing Mga Komponent ng Enterprise
- **Microsoft Foundry**: Managed enterprise AI platform na may seguridad at pagsunod
- **Persistent Agents**: Mga persistente na agent na may kasaysayan ng pag-uusap at pamamahala ng konteksto
- **Vector Store Management**: Enterprise-grade na pag-index at pagkuha ng dokumento
- **Identity Integration**: Azure AD authentication at role-based access control

### Mga Benepisyo ng .NET para sa Enterprise
- **Type Safety**: Pagpapatunay sa compile-time para sa mga operasyon ng RAG at mga istruktura ng datos
- **Asynchronous na Pagganap**: Non-blocking na pagproseso ng dokumento at mga operasyon ng paghahanap
- **Pamamahala ng Memorya**: Epektibong paggamit ng mga resources para sa malalaking koleksyon ng dokumento
- **Mga Pattern ng Integrasyon**: Native na integrasyon ng Azure service kasama ang dependency injection

## üèóÔ∏è Teknikal na Arkitektura

### Pipeline ng Enterprise RAG
```csharp
Document Upload ‚Üí Security Validation ‚Üí Vector Processing ‚Üí Index Creation
                      ‚Üì                    ‚Üì                  ‚Üì
User Query ‚Üí Authentication ‚Üí Semantic Search ‚Üí Context Ranking ‚Üí AI Response
```

### Pangunahing Komponent ng .NET
- **Azure.AI.Agents.Persistent**: Pamamahala ng enterprise agent na may pagpapanatili ng estado
- **Azure.Identity**: Integrated authentication para sa secure na access sa Azure services
- **Microsoft.Agents.AI.AzureAI**: Azure-optimized na implementasyon ng agent framework
- **System.Linq.Async**: Mataas na pagganap na asynchronous na LINQ operations

## üîß Mga Tampok at Benepisyo ng Enterprise

### Seguridad at Pagsunod
- **Azure AD Integration**: Enterprise identity management at authentication
- **Role-Based Access**: Pinong permiso para sa pag-access at operasyon ng dokumento
- **Proteksyon ng Datos**: Encryption habang nakaimpok at habang ipinapadala para sa sensitibong dokumento
- **Pag-log ng Audit**: Komprehensibong pagsubaybay ng aktibidad para sa mga kinakailangan sa pagsunod

### Pagganap at Kakayahang Mag-scale
- **Connection Pooling**: Epektibong pamamahala ng koneksyon sa Azure services
- **Async Processing**: Non-blocking na mga operasyon para sa high-throughput na mga senaryo
- **Caching Strategies**: Matalinong caching para sa madalas na ina-access na mga dokumento
- **Load Balancing**: Distributed na pagproseso para sa malakihang deployment

### Pamamahala at Pagmamanman
- **Health Checks**: Built-in na pagmamanman para sa mga komponent ng RAG system
- **Performance Metrics**: Detalyadong analytics sa kalidad ng paghahanap at oras ng pagtugon
- **Error Handling**: Komprehensibong pamamahala ng exception na may mga retry policy
- **Configuration Management**: Mga setting na tukoy sa environment na may validation

## ‚öôÔ∏è Mga Kinakailangan at Pag-setup

**Kapaligiran ng Pag-develop:**
- .NET 9.0 SDK or higher
- Visual Studio 2022 o VS Code na may C# extension
- Azure subscription na may AI Foundry access

**Required NuGet Packages:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure Authentication Setup:**
```bash
# I-install ang Azure CLI at mag-login
az login
az account set --subscription "your-subscription-id"
```

**Kompigurasyon ng Kapaligiran (.env file):**
```env
# Microsoft Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## üìä Mga Pattern ng Enterprise RAG

### Mga Pattern ng Pamamahala ng Dokumento
- **Bulk Upload**: Epektibong pagproseso ng malalaking koleksyon ng dokumento
- **Incremental Updates**: Real-time na pagdagdag at pagbabago ng dokumento
- **Version Control**: Pagve-version ng dokumento at pagsubaybay ng mga pagbabago
- **Metadata Management**: Mayamang mga attribute ng dokumento at taxonomy

### Mga Pattern ng Paghahanap at Pagkuha
- **Hybrid Search**: Pagsasama ng semantik at keyword search para sa optimal na resulta
- **Faceted Search**: Multi-dimensional na pag-filter at pag-categorize
- **Relevance Tuning**: Custom na scoring algorithms para sa domain-specific na pangangailangan
- **Result Ranking**: Advanced na pag-ranggo na may integrasyon ng business logic

### Mga Pattern ng Seguridad
- **Document-Level Security**: Pinong access control kada dokumento
- **Data Classification**: Awtomatikong pag-label ng sensitibidad at proteksyon
- **Audit Trails**: Komprehensibong pag-log ng lahat ng operasyon ng RAG
- **Privacy Protection**: Pagtuklas at pag-redact ng PII

## üîí Mga Tampok ng Seguridad ng Enterprise

### Pagpapatotoo at Awtorisasyon
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Proteksyon ng Datos
- **Encryption**: End-to-end encryption para sa mga dokumento at search indices
- **Access Controls**: Integrasyon sa Azure AD para sa user at group permissions
- **Data Residency**: Kontrol sa lokasyon ng datos para sa pagsunod
- **Backup & Recovery**: Awtomatikong backup at kakayahan sa disaster recovery

## üìà Pag-optimize ng Pagganap

### Mga Pattern ng Asynchronous na Pagproseso
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Pamamahala ng Memorya
- **Streaming Processing**: Pangasiwaan ang malalaking dokumento nang walang isyu sa memorya
- **Resource Pooling**: Epektibong muling paggamit ng magastos na mga resource
- **Garbage Collection**: Na-optimize na pattern ng allocation ng memorya
- **Connection Management**: Wastong lifecycle ng koneksyon sa Azure services

### Mga Estratehiya sa Caching
- **Query Caching**: I-cache ang madalas na ipinapatupad na mga paghahanap
- **Document Caching**: In-memory caching para sa hot documents
- **Index Caching**: Na-optimize na caching ng vector index
- **Result Caching**: Matalinong caching ng mga generated na tugon

## üìä Mga Kaso ng Paggamit ng Enterprise

### Pamamahala ng Kaalaman
- **Corporate Wiki**: Intelihenteng paghahanap sa mga knowledge base ng kumpanya
- **Policy & Procedures**: Awtomatiko na pagsunod at gabay sa mga pamamaraan
- **Training Materials**: Intelihenteng tulong para sa pagkatuto at pag-develop
- **Research Databases**: Mga sistema para sa pagsusuri ng academic at research paper

### Suporta sa Customer
- **Support Knowledge Base**: Awtomatikong mga tugon para sa customer service
- **Product Documentation**: Intelihenteng pagkuha ng impormasyon ng produkto
- **Troubleshooting Guides**: Kontekstuwal na tulong sa paglutas ng problema
- **FAQ Systems**: Dynamic na generasyon ng FAQ mula sa koleksyon ng dokumento

### Pagsunod sa Regulasyon
- **Legal Document Analysis**: Intelihensiya ng kontrata at legal na dokumento
- **Compliance Monitoring**: Awtomatikong pagsuri sa pagsunod sa regulasyon
- **Risk Assessment**: Pagsusuri at pag-uulat ng panganib batay sa dokumento
- **Audit Support**: Intelihenteng pagtuklas ng dokumento para sa audits

## üöÄ Pag-deploy sa Produksyon

### Pagmamanman at Observability
- **Application Insights**: Detalyadong telemetry at pagmamanman ng pagganap
- **Custom Metrics**: Pagsubaybay at alerting para sa business-specific na KPI
- **Distributed Tracing**: End-to-end na pagsubaybay ng request sa mga serbisyo
- **Health Dashboards**: Real-time na visualisasyon ng kalusugan at pagganap ng sistema

### Kakayahang Mag-scale at Maaasahan
- **Auto-Scaling**: Awtomatikong pag-scale batay sa load at performance metrics
- **High Availability**: Multi-region deployment na may failover capabilities
- **Load Testing**: Pag-validate ng pagganap sa ilalim ng enterprise load conditions
- **Disaster Recovery**: Awtomatikong mga pamamaraan para sa backup at recovery

Handa ka na bang bumuo ng enterprise-grade RAG systems na kayang hawakan ang sensitibong dokumento sa malakihang sukat? Magsimula tayo sa pag-arkitekto ng intelihenteng mga sistema ng kaalaman para sa enterprise! üè¢üìñ‚ú®


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling„Äê4:0‚Ä†demo.md„Äë.


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
Paunawa:
Isinalin ang dokumentong ito gamit ang AI na serbisyo ng pagsasalin na Co-op Translator (https://github.com/Azure/co-op-translator). Bagaman nagsusumikap kami para sa katumpakan, pakitandaan na ang awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatumpak. Dapat ituring na awtoritatibong sanggunian ang orihinal na dokumento sa orihinal nitong wika. Para sa mahahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na nagmumula sa paggamit ng pagsasaling ito.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
