# Byg med Meta-familien af modeller

## Introduktion

Denne lektion dækker:

- Gennemgang af de to vigtigste modeller i Meta-familien – Llama 3.1 og Llama 3.2
- Forståelse af anvendelsesmuligheder og scenarier for hver model
- Eksempel på kode, der viser de unikke egenskaber ved hver model

## Meta-familien af modeller

I denne lektion ser vi nærmere på 2 modeller fra Meta-familien eller "Llama-flokken" – Llama 3.1 og Llama 3.2

Disse modeller findes i forskellige varianter og kan hentes på Github Model marketplace. Her kan du læse mere om, hvordan du bruger Github Models til at [prototyping med AI-modeller](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Modelvarianter:
- Llama 3.1 – 70B Instruct
- Llama 3.1 – 405B Instruct
- Llama 3.2 – 11B Vision Instruct
- Llama 3.2 – 90B Vision Instruct

*Bemærk: Llama 3 findes også på Github Models, men den bliver ikke gennemgået i denne lektion*


## Llama 3.1

Med 405 milliarder parametre hører Llama 3.1 til i kategorien for open source LLM.

Denne version er en opgradering af den tidligere Llama 3 og tilbyder:

- Større kontekstvindue - 128k tokens mod 8k tokens
- Større maks. output tokens - 4096 mod 2048
- Bedre flersproget support - på grund af flere træningstokens

Disse forbedringer gør Llama 3.1 i stand til at håndtere mere komplekse brugsscenarier, når man bygger GenAI-applikationer, herunder:
- Indbygget funktionkald - muligheden for at kalde eksterne værktøjer og funktioner uden for LLM-arbejdsflowet
- Bedre RAG-ydeevne - takket være det større kontekstvindue
- Generering af syntetiske data - muligheden for at skabe effektiv data til opgaver som finjustering


### Native Function Calling

Llama 3.1 er blevet finjusteret til at være mere effektiv til at foretage funktions- eller værktøjskald. Den har også to indbyggede værktøjer, som modellen kan identificere som nødvendige at bruge baseret på brugerens prompt. Disse værktøjer er:

- **Brave Search** – Kan bruges til at hente opdateret information som vejret ved at udføre en websøgning
- **Wolfram Alpha** – Kan bruges til mere komplekse matematiske beregninger, så du ikke behøver at skrive dine egne funktioner.

Du kan også oprette dine egne brugerdefinerede værktøjer, som LLM kan kalde.

I kodeeksemplet nedenfor:

- Vi definerer de tilgængelige værktøjer (brave_search, wolfram_alpha) i systemprompten.
- Sender en brugerprompt, der spørger om vejret i en bestemt by.
- LLM’en vil svare med et værktøjskald til Brave Search-værktøjet, som vil se sådan ud: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Bemærk: Dette eksempel foretager kun værktøjskaldet. Hvis du ønsker at få resultaterne, skal du oprette en gratis konto på Brave API-siden og selv definere funktionen.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Selvom Llama 3.1 er en LLM, har den en begrænsning, når det gælder multimodalitet. Det vil sige, at den ikke kan bruge forskellige typer input som f.eks. billeder som prompts og give svar. Denne evne er en af hovedfunktionerne i Llama 3.2. Disse funktioner omfatter også:

- Multimodalitet – har evnen til at evaluere både tekst- og billedprompts
- Små til mellemstore varianter (11B og 90B) – dette giver fleksible muligheder for implementering,
- Kun tekst-varianter (1B og 3B) – dette gør det muligt at implementere modellen på edge-/mobillenheder og giver lav latenstid

Den multimodale understøttelse er et stort skridt i verden af open source-modeller. Eksemplet nedenfor tager både et billede og en tekstprompt for at få en analyse af billedet fra Llama 3.2 90B.

### Multimodal understøttelse med Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Læringen stopper ikke her, fortsæt rejsen

Når du har gennemført denne lektion, kan du tage et kig på vores [Generative AI Learning collection](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) for at fortsætte med at udbygge din viden om Generativ AI!



---

**Ansvarsfraskrivelse**:  
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiske oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel, menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå ved brug af denne oversættelse.
