### Introduktion i LLM i Python ###

- Hvad er det grundlæggende ved en LLM og hvad kan det bruges til?

- Hvad er RAG og Agentic RAG og hvorfor bruger man dem?

- Hvad er Embeddings og hvordan bruges de af LLMs?

- Hvordan bruger man text, audio, image og video embeddings models?

**Hvad er RAG (Retrieval-augmented Generation)?**

RAG er en metode, hvor en AI-model kombinerer en LLM med eksterne informationskilder.
- En generativ model (LLM) generer tekst som svar på en PROMPT
- RAG forbedrer denne proces ved at hente relevante data fra eksterne databaser, dokumenter eller API'er, får den genererer et svar

**Hvorfor bruges RAG?**

- Traditionelle LLM'er uden RAG har forældet eller begrænset viden. Modellen er kun så god som den data, den blev trænet på
- Tradionelle LLM'er risikerer at hallucineres, ved at opfinde falske ellr misvisende svar, hvis den mangler data. 

Fordel med RAG:
- Henter opdateredeog troværdige data fra troværdige eksterne kilder eller database.
- Svarene baseres på verificerede data og reducer risikoen for hallucinationer

**Hvordan opdateres data i RAG?**

- Ved at tilføje nye informationskilder
- Forbedre søgealgoritmen, så de henter mere præcise resultater
- Finetuning af modellen ved at give den flere eksempler på gode svar

**Hvad er AI-Agents?**

Systemer, der kan forstå, planlægge og handle ved at kombinere forskellige komponenter såsom store sprogmodeller (LLMs), værktøjer og hukommelse.

Shift model - Isoleret AI-modeller 
- Tradionel LLM der kun svarer ud fra sin træning
- Ingen adgang til opdaterede data eller eksterne værktøjer
- Begrænsning, modellen kan ikke opdatere nye data
- Eksempel: En statisk chatbot, der kun kan svare baseret på dens forudtrænede viden, men kan ikke søge på internettet.

Compound Systemer - AI-System
- Kombinerer flere komponenter og flere værktøjer
- LLLM kan søge efter eksterne værktøjer, som databaser, søgning i web, brug af API'er, osv...
- Dynamisk læring, hvilket kan hente opdaterede data i realtid.
- Eksempel:En AI-agent(Le Chat), der kombinerer en LLM med en internetsøgemaskine, så den kan finde de nyeste informationer.

Komponenter i LLM Agent
1. Planlægning (Reasoning): Modellen analyserer problemet/prompt/query og laver en trin-for-trin plan for at løse det.

2. Handling (Take Action): Modeller bruger værktøjer til at hente ellr genrere information. Eksempler på værktøjer: 
- Websøgning , 
- Database-forespørgsel, 
- Lommeregner, 
- API-kald
- Sprogmodeller

3. Hukommelse: Modellen kan gemme logfiler fra tidligere prompts,
- Eksempel: Gemme tidligere samtaler for at gøre interaktionen mere personlig

Kontrol logik:
1. Pragmatisk kontrol
- Fordel: Hurtig generering, 
- God til små og veldefinerede problemer

2. Agent-baseret kontrol (Generisk):
- Dybere ræsonnering, bedre til komplekse opgaver
- Langsommere generering

Hvad er AI_autonomi?
- Hvor meget frihed agenten har til at tage beslutninger uden menneskelig input. 

**Hvad sker der, når en ReAct-agent konfigureres?**

1. Brugeren stiller en forespørgsel/prompt 
2. LLM planlægger et svar  
3. Modellen forsøger at handle (f.eks. via eksterne værktøjer) 
4. Modellen evaluerer svaret:
- Hvis svarer besvarer brugerens prompt: Returner det til brugeren
- Ellers: Gentages processen indtil prompten endelig er besvaret

**Hvad er Agentic RAG?**

Agentic RAG (Retrieval-Augmented Generation) er en avanceret version af den klassiske RAG-arkitektur, der kombinerer information hentet fra eksterne kilder med en Large Language Model (LLM) for at generere mere præcise og kontekstuelle svar. Agentic betyder, at modellen fungerer som en "agent", der kan tage flere beslutninger, planlægge og iterativt forbedre sin informationssøgning.

**Hvad er Transformers?**

Arkitektur/Deep-learning model, som bruges i LLM til at forstå og generere tekst. Består af 2 hoveddele:
- Encoder - Læser og forstår tekst
- Decoder - Genererer ny tekst

**Hvordan fungerer en LLM (Large Language Models)?**

Maskinlæringsmode baseret på netural netværkteknikker, til at forstå og generere sprog trænet på massive tekstdata.

Fungerer ved hjælp af deep learning, som er trænet på massive datasæt og masse tekniske egenskaber 

**Hvad er Embeddings og hvordan bruges de i LLM?**

Embeddings er kontinuerlig vektor repræsentationer af diskrete data. De fungerer som en bro mellem de rå data og maskinlæringsmodellerne ved at konvertere kategoriske eller tekstdata til numerisk form, som modeller kan behandle effektivt. Målet med indlejringer er at fange den semantiske betydning og relationer inden for dataene på en måde, at lignende genstande er tættere sammen i indlejringsrummet.

Embeddinger er afgørende, fordi de gør det muligt for modeller at håndtere og lære af højdimensionelle data effektivt. De reducerer beregningsmæssig kompleksitet og øger evnen til at generalisere fra dataene

**Hvordan bruger man text, audio, image, video embedding models?**

Tekst:
Word indlejringer bruges til at repræsentere ord i et kontinuerligt vektorrum. Populære teknikker omfatter Word2Vec, GloVe og FastText. Disse metoder lærer indlejringer baseret på den kontekst, hvori ord vises, idet de fanger semantiske ligheder mellem ord.
Eksempel

I Word2Vec kan ordene "konge" og "dronning" have lignende vektorer, fordi de deler lignende sammenhænge, mens "konge" og "æble" ville have forskellige vektorer på grund af deres forskellige sammenhænge.

Audio:
Lydindlejringer konverterer lydsignaler til et lavere dimensionelt rum, der fanger væsentlige funktioner som fonetisk indhold, højttaleregenskaber eller følelsesmæssig tone. Disse indlejringer er almindeligt anvendt i opgaver som talegenkendelse, højttaleridentifikation og følelsesdetektering.
Eksempel

Mel-frekvens cepstral koefficienter (MFCC'er) er almindeligt anvendte funktioner til lydindlejringer. Mere avancerede teknikker involverer brug af præ-trænede modeller som VGGish, som er baseret på VGG-arkitekturen, men tilpasset til lyddata.

Image:
I computersyn genereres billedindlejringer for at repræsentere billeder i et lavere dimensionelt rum. Convolutional Neural Networks (CNN'er) udtrækker ofte disse indlejringer fra de sidste lag af netværket, som derefter kan bruges til opgaver som billedklassifikation, objektdetektering og billedlighed.
Eksempel

Et CNN kan producere en 256-dimensionel indlejring til et billede af en kat, som derefter kan sammenlignes med andre indlejringer for at finde lignende billeder eller klassificere billedet som en kat.


Video: ???

**Hvordan bruges Mistral.ai embeddings i API'er i sammenspil med ChromaDB?**

- Mistral.ai tilbyder en API der kan generere embeddings fra tekst.
- ChromaDB er en vektordatabase til at gemme og forespørge embeddings
- Gem embedings MAI i databasen
- Databasen giver dig mulighed for hurtigt at finde embeddings der er tæt på en forespørgselsembedding

I en typisk API-integration vil du:

- Modtage en tekstforespørgsel fra en bruger.
- Bruge Mistral AI's embeddings-API til at generere en embedding for forespørgslen.
- Bruge ChromaDB til at søge efter embeddings, der er tæt  forespørgselsembeddingen.
- Hente de tilsvarende tekster fra din database.
- Returnere resultaterne til brugeren.

**Kilder**
https://www.geeksforgeeks.org/what-is-retrieval-augmented-generation-rag/



## Øvelse - Text Embeddings ##