# 🔍 Yritystason RAG Azure AI Foundrylla (.NET)

## 📋 Oppimistavoitteet

Tämä notebook esittelee, kuinka rakentaa yritystason Retrieval-Augmented Generation (RAG) -järjestelmiä Microsoft Agent Frameworkin avulla .NET:ssä ja Azure AI Foundryssa. Opit luomaan tuotantovalmiita agentteja, jotka voivat etsiä dokumentteja ja tarjota tarkkoja, kontekstitietoisia vastauksia yritystason turvallisuudella ja skaalautuvuudella.

**Yritystason RAG-ominaisuudet, joita rakennat:**
- 📚 **Dokumenttien älykkyys**: Kehittynyt dokumenttien käsittely Azure AI -palveluilla
- 🔍 **Semanttinen haku**: Suorituskykyinen vektorihaku yritysominaisuuksilla
- 🛡️ **Turvallisuusintegraatio**: Roolipohjainen pääsy ja tietosuojamallit
- 🏢 **Skaalautuva arkkitehtuuri**: Tuotantovalmiit RAG-järjestelmät valvonnalla

## 🎯 Yritystason RAG-arkkitehtuuri

### Keskeiset yrityskomponentit
- **Azure AI Foundry**: Hallinnoitu yritystason AI-alusta turvallisuudella ja vaatimustenmukaisuudella
- **Pysyvät agentit**: Tilalliset agentit keskusteluhistorian ja kontekstinhallinnan kanssa
- **Vektorivaraston hallinta**: Yritystason dokumenttien indeksointi ja haku
- **Identiteetti-integraatio**: Azure AD -autentikointi ja roolipohjainen pääsynhallinta

### .NET-yrityshyödyt
- **Tyyppiturvallisuus**: Kääntöaikainen validointi RAG-toiminnoille ja tietorakenteille
- **Asynkroninen suorituskyky**: Ei-blokkaava dokumenttien käsittely ja hakutoiminnot
- **Muistinhallinta**: Tehokas resurssien käyttö suurille dokumenttikokoelmille
- **Integraatiomallit**: Natiivisti Azure-palveluihin integroituminen riippuvuuksien injektiolla

## 🏗️ Tekninen arkkitehtuuri

### Yritystason RAG-putkisto
```csharp
Document Upload → Security Validation → Vector Processing → Index Creation
                      ↓                    ↓                  ↓
User Query → Authentication → Semantic Search → Context Ranking → AI Response
```

### Keskeiset .NET-komponentit
- **Azure.AI.Agents.Persistent**: Yritysagenttien hallinta tilan pysyvyydellä
- **Azure.Identity**: Integroitu autentikointi turvalliseen Azure-palveluiden käyttöön
- **Microsoft.Agents.AI.AzureAI**: Azure-optimoitu agenttikehys
- **System.Linq.Async**: Suorituskykyiset asynkroniset LINQ-toiminnot

## 🔧 Yritystason ominaisuudet ja hyödyt

### Turvallisuus ja vaatimustenmukaisuus
- **Azure AD -integraatio**: Yrityksen identiteetinhallinta ja autentikointi
- **Roolipohjainen pääsy**: Tarkat käyttöoikeudet dokumenttien käyttöön ja toimintoihin
- **Tietosuoja**: Salaus levossa ja siirrossa arkaluontoisille dokumenteille
- **Auditointilokit**: Kattava toiminnan seuranta vaatimustenmukaisuuden varmistamiseksi

### Suorituskyky ja skaalautuvuus
- **Yhteyspoolaus**: Tehokas Azure-palveluiden yhteyksien hallinta
- **Asynkroninen käsittely**: Ei-blokkaavat toiminnot korkean läpimenon skenaarioihin
- **Välimuististrategiat**: Älykäs välimuisti usein käytetyille dokumenteille
- **Kuormantasapainotus**: Hajautettu käsittely suurten järjestelmien käyttöönottoon

### Hallinta ja valvonta
- **Terveystarkistukset**: Sisäänrakennettu valvonta RAG-järjestelmän komponenteille
- **Suorituskykymittarit**: Yksityiskohtainen analytiikka hakulaadusta ja vasteajoista
- **Virheenkäsittely**: Kattava poikkeusten hallinta ja uudelleenyrittämiskäytännöt
- **Konfiguraation hallinta**: Ympäristökohtaiset asetukset validoinnilla

## ⚙️ Esivaatimukset ja asennus

**Kehitysympäristö:**
- .NET 9.0 SDK tai uudempi
- Visual Studio 2022 tai VS Code C#-laajennuksella
- Azure-tilaus AI Foundry -pääsyllä

**Vaaditut NuGet-paketit:**
```xml
<PackageReference Include="Microsoft.Extensions.AI" Version="9.9.0" />
<PackageReference Include="Azure.AI.Agents.Persistent" Version="1.2.0-beta.5" />
<PackageReference Include="Azure.Identity" Version="1.15.0" />
<PackageReference Include="System.Linq.Async" Version="6.0.3" />
<PackageReference Include="DotNetEnv" Version="3.1.1" />
```

**Azure-autentikoinnin asennus:**
```bash
# Install Azure CLI and authenticate
az login
az account set --subscription "your-subscription-id"
```

**Ympäristön konfiguraatio (.env-tiedosto):**
```env
# Azure AI Foundry configuration (automatically handled via Azure CLI)
# Ensure you're authenticated to the correct Azure subscription
```

## 📊 Yritystason RAG-mallit

### Dokumenttien hallintamallit
- **Massalataus**: Tehokas suurten dokumenttikokoelmien käsittely
- **Inkrementaaliset päivitykset**: Reaaliaikainen dokumenttien lisäys ja muokkaus
- **Versiohallinta**: Dokumenttien versiointi ja muutosten seuranta
- **Metatietojen hallinta**: Rikkaat dokumenttiattribuutit ja taksonomia

### Haku- ja hakumallit
- **Hybridihaku**: Semanttisen ja avainsanahaun yhdistäminen optimaalisiin tuloksiin
- **Fasettihaku**: Moniulotteinen suodatus ja kategorisointi
- **Relevanssin säätö**: Mukautetut pisteytysalgoritmit toimialakohtaisiin tarpeisiin
- **Tulosten järjestäminen**: Kehittynyt järjestäminen liiketoimintalogiikan integroinnilla

### Turvallisuusmallit
- **Dokumenttikohtainen turvallisuus**: Tarkat käyttöoikeudet dokumenttikohtaisesti
- **Tietojen luokittelu**: Automaattinen arkaluontoisuuden merkintä ja suojaus
- **Auditointijäljet**: Kattava lokitus kaikille RAG-toiminnoille
- **Yksityisyyden suoja**: PII-tunnistus ja peittokäsittely

## 🔒 Yritystason turvallisuusominaisuudet

### Autentikointi ja valtuutus
```csharp
// Azure AD integrated authentication
var credential = new AzureCliCredential();
var agentsClient = new PersistentAgentsClient(endpoint, credential);

// Role-based access validation
if (!await ValidateUserPermissions(user, documentId))
{
    throw new UnauthorizedAccessException("Insufficient permissions");
}
```

### Tietosuoja
- **Salaus**: Päästä päähän -salaus dokumenteille ja hakemistoille
- **Käyttöoikeudet**: Integraatio Azure AD:n käyttäjä- ja ryhmäoikeuksiin
- **Tietojen sijainti**: Maantieteellinen tietojen sijainnin hallinta vaatimustenmukaisuuden vuoksi
- **Varmuuskopiointi ja palautus**: Automaattiset varmuuskopiointi- ja katastrofipalautuskäytännöt

## 📈 Suorituskyvyn optimointi

### Asynkroniset käsittelymallit
```csharp
// Efficient async document processing
await foreach (var document in documentStream.AsAsyncEnumerable())
{
    await ProcessDocumentAsync(document, cancellationToken);
}
```

### Muistinhallinta
- **Suoratoistokäsittely**: Suurten dokumenttien käsittely ilman muistiongelmia
- **Resurssien poolaus**: Kalliiden resurssien tehokas uudelleenkäyttö
- **Roskankeruu**: Optimoidut muistiallokointimallit
- **Yhteydenhallinta**: Oikea Azure-palveluyhteyksien elinkaaren hallinta

### Välimuististrategiat
- **Hakuvälimuisti**: Usein suoritettujen hakujen välimuisti
- **Dokumenttivälimuisti**: Kuumien dokumenttien välimuisti muistissa
- **Indeksivälimuisti**: Optimoitu vektorihakemiston välimuisti
- **Tulosten välimuisti**: Älykäs välimuisti generoituja vastauksia varten

## 📊 Yritystason käyttötapaukset

### Tiedonhallinta
- **Yrityksen wiki**: Älykäs haku yrityksen tietokannoissa
- **Politiikat ja menettelytavat**: Automaattinen vaatimustenmukaisuus ja ohjeistus
- **Koulutusmateriaalit**: Älykäs oppimisen ja kehityksen tuki
- **Tutkimustietokannat**: Akateemisten ja tutkimuspapereiden analyysijärjestelmät

### Asiakastuki
- **Tukitietokanta**: Automaattiset asiakaspalveluvastaukset
- **Tuotedokumentaatio**: Älykäs tuotetiedon haku
- **Vianetsintäoppaat**: Kontekstuaalinen ongelmanratkaisun tuki
- **FAQ-järjestelmät**: Dynaaminen FAQ:n luominen dokumenttikokoelmista

### Sääntelyn vaatimustenmukaisuus
- **Oikeudellisten dokumenttien analyysi**: Sopimusten ja oikeudellisten dokumenttien älykkyys
- **Vaatimustenmukaisuuden seuranta**: Automaattinen sääntelyn vaatimustenmukaisuuden tarkistus
- **Riskien arviointi**: Dokumenttipohjainen riskianalyysi ja raportointi
- **Auditointituki**: Älykäs dokumenttien etsintä auditointeihin

## 🚀 Tuotantokäyttöönotto

### Valvonta ja havainnointi
- **Application Insights**: Yksityiskohtainen telemetria ja suorituskyvyn valvonta
- **Mukautetut mittarit**: Liiketoimintakohtainen KPI-seuranta ja hälytykset
- **Hajautettu jäljitys**: Pyyntöjen end-to-end-seuranta palveluiden välillä
- **Terveysnäkymät**: Reaaliaikainen järjestelmän terveyden ja suorituskyvyn visualisointi

### Skaalautuvuus ja luotettavuus
- **Automaattinen skaalautuminen**: Automaattinen skaalautuminen kuorman ja suorituskykymittareiden perusteella
- **Korkea käytettävyys**: Monialueinen käyttöönotto varajärjestelmillä
- **Kuormitustestaus**: Suorituskyvyn validointi yritystason kuormituksessa
- **Katastrofipalautus**: Automaattiset varmuuskopiointi- ja palautuskäytännöt

Valmiina rakentamaan yritystason RAG-järjestelmiä, jotka käsittelevät arkaluontoisia dokumentteja skaalautuvasti? Suunnitellaan älykkäitä tietojärjestelmiä yrityksille! 🏢📖✨


In [1]:
#r "nuget: Microsoft.Extensions.AI, 9.9.1"

In [2]:
#r "nuget: Azure.AI.Agents.Persistent, 1.2.0-beta.5"
#r "nuget: Azure.Identity, 1.15.0"
#r "nuget: System.Linq.Async, 6.0.3"

In [None]:
#r "nuget: Microsoft.Agents.AI.AzureAI, 1.0.0-preview.251001.3"

In [None]:
#r "nuget: Microsoft.Agents.AI, 1.0.0-preview.251001.3"

In [6]:
#r "nuget: DotNetEnv, 3.1.1"

In [7]:
using System;
using System.Linq;
using Azure.AI.Agents.Persistent;
using Azure.Identity;
using Microsoft.Agents.AI;

In [8]:
 using DotNetEnv;

In [9]:
Env.Load("../../../.env");

In [10]:
var azure_foundry_endpoint = Environment.GetEnvironmentVariable("AZURE_AI_PROJECT_ENDPOINT") ?? throw new InvalidOperationException("AZURE_AI_PROJECT_ENDPOINT is not set.");
var azure_foundry_model_id = Environment.GetEnvironmentVariable("AZURE_AI_MODEL_DEPLOYMENT_NAME") ?? "gpt-4.1-mini";

In [11]:
string pdfPath = "./document.md";

In [12]:
using System.IO;

async Task<Stream> OpenImageStreamAsync(string path)
{
	return await Task.Run(() => File.OpenRead(path));
}

var pdfStream = await OpenImageStreamAsync(pdfPath);

In [13]:
var persistentAgentsClient = new PersistentAgentsClient(azure_foundry_endpoint, new AzureCliCredential());

In [14]:
PersistentAgentFileInfo fileInfo = await persistentAgentsClient.Files.UploadFileAsync(pdfStream, PersistentAgentFilePurpose.Agents, "demo.md");

In [15]:
PersistentAgentsVectorStore fileStore =
            await persistentAgentsClient.VectorStores.CreateVectorStoreAsync(
                [fileInfo.Id],
                metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [16]:
PersistentAgent agentModel = await persistentAgentsClient.Administration.CreateAgentAsync(
            azure_foundry_model_id,
            name: "DotNetRAGAgent",
            tools: [new FileSearchToolDefinition()],
            instructions: """
                You are an AI assistant designed to answer user questions using only the information retrieved from the provided document(s).

                - If a user's question cannot be answered using the retrieved context, **you must clearly respond**: 
                "I'm sorry, but the uploaded document does not contain the necessary information to answer that question."
                - Do not answer from general knowledge or reasoning. Do not make assumptions or generate hypothetical explanations.
                - Do not provide definitions, tutorials, or commentary that is not explicitly grounded in the content of the uploaded file(s).
                - If a user asks a question like "What is a Neural Network?", and this is not discussed in the uploaded document, respond as instructed above.
                - For questions that do have relevant content in the document (e.g., Contoso's travel insurance coverage), respond accurately, and cite the document explicitly.

                You must behave as if you have no external knowledge beyond what is retrieved from the uploaded document.
                """,
            toolResources: new()
            {
                FileSearch = new()
                {
                    VectorStoreIds = { fileStore.Id },
                }
            },
            metadata: new Dictionary<string, string>() { { "agentkey", bool.TrueString } });

In [17]:
AIAgent agent = await persistentAgentsClient.GetAIAgentAsync(agentModel.Id);

In [18]:
AgentThread thread = agent.GetNewThread();

In [19]:
Console.WriteLine(await agent.RunAsync("Can you explain Contoso's travel insurance coverage?", thread));

Contoso's travel insurance coverage includes protection for medical emergencies, trip cancellations, and lost baggage. This ensures that travelers are supported in case of health-related issues during their trip, unforeseen cancellations, and the loss of their belongings while traveling【4:0†demo.md】.



---

**Vastuuvapauslauseke**:  
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.
