# Bygging med Meta-familiemodellene

## Introduksjon

Denne leksjonen vil dekke:

- Utforske de to hovedmodellene i Meta-familien – Llama 3.1 og Llama 3.2
- Forstå bruksområder og scenarier for hver modell
- Kodeeksempel som viser de unike egenskapene til hver modell

## Meta-familiens modeller

I denne leksjonen skal vi se nærmere på 2 modeller fra Meta-familien, eller "Llama-flokken" – Llama 3.1 og Llama 3.2

Disse modellene finnes i ulike varianter og er tilgjengelige på Github Model marketplace. Her finner du mer informasjon om hvordan du kan bruke Github Models til å [prototype med AI-modeller](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Modellvarianter:
- Llama 3.1 – 70B Instruct
- Llama 3.1 – 405B Instruct
- Llama 3.2 – 11B Vision Instruct
- Llama 3.2 – 90B Vision Instruct

*Merk: Llama 3 er også tilgjengelig på Github Models, men vil ikke bli gjennomgått i denne leksjonen*


## Llama 3.1

Med 405 milliarder parametere faller Llama 3.1 inn under kategorien åpne kildekode-LLM-er.

Modellen er en oppgradering fra den tidligere utgaven Llama 3 ved å tilby:

- Større kontekstvindu – 128k tokens mot 8k tokens
- Større maks antall utdata-tokens – 4096 mot 2048
- Bedre flerspråklig støtte – takket være økning i antall treningstokens

Dette gjør at Llama 3.1 kan håndtere mer komplekse bruksområder når man bygger GenAI-applikasjoner, inkludert:
- Naturlig funksjonskall – muligheten til å kalle eksterne verktøy og funksjoner utenfor LLM-arbeidsflyten
- Bedre RAG-ytelse – på grunn av det større kontekstvinduet
- Generering av syntetiske data – muligheten til å lage effektiv data for oppgaver som finjustering


### Native funksjonskalling

Llama 3.1 har blitt finjustert for å være mer effektiv til å gjøre funksjons- eller verktøykall. Den har også to innebygde verktøy som modellen kan identifisere at bør brukes basert på brukerens prompt. Disse verktøyene er:

- **Brave Search** – Kan brukes for å hente oppdatert informasjon som været ved å gjøre et nettsøk
- **Wolfram Alpha** – Kan brukes for mer avanserte matematiske utregninger, slik at du slipper å skrive egne funksjoner.

Du kan også lage dine egne tilpassede verktøy som LLM kan kalle på.

I kodeeksempelet under:

- Vi definerer tilgjengelige verktøy (brave_search, wolfram_alpha) i systemprompten.
- Sender en brukerprompt som spør om været i en bestemt by.
- LLM vil svare med et verktøykall til Brave Search-verktøyet, som vil se slik ut: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Merk: Dette eksempelet gjør kun verktøykallet. Hvis du ønsker å få resultatene, må du opprette en gratis konto på Brave API-siden og definere selve funksjonen.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Selv om Llama 3.1 er en LLM, har den en begrensning når det gjelder multimodalitet. Det vil si, å kunne bruke ulike typer input som bilder som prompt og gi svar. Denne evnen er en av hovedfunksjonene i Llama 3.2. Disse funksjonene inkluderer også:

- Multimodalitet – har mulighet til å evaluere både tekst- og bildeprompter
- Små til mellomstore varianter (11B og 90B) – dette gir fleksible muligheter for utrulling,
- Kun tekst-varianter (1B og 3B) – dette gjør det mulig å bruke modellen på edge- og mobile enheter og gir lav ventetid

Støtten for multimodalitet er et stort steg i verden av åpne kildekode-modeller. Eksempelet under tar både et bilde og en tekstprompt for å få en analyse av bildet fra Llama 3.2 90B.

### Multimodal støtte med Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Læringen stopper ikke her, fortsett reisen

Etter at du har fullført denne leksjonen, ta en titt på vår [Generative AI Learning collection](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) for å fortsette å utvikle kunnskapen din om Generativ AI!



---

**Ansvarsfraskrivelse**:  
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten [Co-op Translator](https://github.com/Azure/co-op-translator). Selv om vi tilstreber nøyaktighet, vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det opprinnelige dokumentet på sitt originale språk skal anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell, menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.
