# Bygga med Meta-familjens modeller

## Introduktion

Den här lektionen kommer att ta upp:

- Utforska de två huvudsakliga modellerna i Meta-familjen – Llama 3.1 och Llama 3.2
- Förstå användningsområden och scenarier för varje modell
- Kodexempel som visar de unika egenskaperna hos varje modell

## Meta-familjens modeller

I den här lektionen kommer vi att titta på två modeller från Meta-familjen eller "Llama Herd" – Llama 3.1 och Llama 3.2

Dessa modeller finns i olika varianter och är tillgängliga på Github Model marketplace. Här finns mer information om hur du använder Github Models för att [prototypa med AI-modeller](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Modellvarianter:
- Llama 3.1 – 70B Instruct
- Llama 3.1 – 405B Instruct
- Llama 3.2 – 11B Vision Instruct
- Llama 3.2 – 90B Vision Instruct

*Obs: Llama 3 finns också på Github Models men kommer inte att tas upp i denna lektion*


## Llama 3.1

Med 405 miljarder parametrar räknas Llama 3.1 som en öppen källkods-LLM.

Modellen är en uppgradering av den tidigare versionen Llama 3 och erbjuder:

- Större kontextfönster – 128k tokens jämfört med 8k tokens
- Större max antal utdata-tokens – 4096 jämfört med 2048
- Bättre flerspråkigt stöd – tack vare fler tränings-tokens

Detta gör att Llama 3.1 kan hantera mer avancerade användningsområden vid utveckling av GenAI-applikationer, inklusive:
- Inbyggd funktionsanropning – möjligheten att använda externa verktyg och funktioner utanför LLM-flödet
- Bättre RAG-prestanda – tack vare det större kontextfönstret
- Generering av syntetisk data – möjligheten att skapa effektiv data för exempelvis finjustering


### Inbyggd funktionsanrop

Llama 3.1 har finjusterats för att vara mer effektiv på att göra funktions- eller verktygsanrop. Den har också två inbyggda verktyg som modellen kan identifiera som nödvändiga att använda baserat på användarens prompt. Dessa verktyg är:

- **Brave Search** – Kan användas för att hämta aktuell information som vädret genom att göra en webbsökning
- **Wolfram Alpha** – Kan användas för mer avancerade matematiska beräkningar så att du inte behöver skriva egna funktioner.

Du kan även skapa egna anpassade verktyg som LLM kan anropa.

I kodexemplet nedan:

- Vi definierar de tillgängliga verktygen (brave_search, wolfram_alpha) i systemprompten.
- Skickar en användarprompt som frågar om vädret i en viss stad.
- LLM kommer att svara med ett verktygsanrop till Brave Search-verktyget som kommer att se ut så här: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Observera: Det här exemplet gör endast verktygsanropet. Om du vill få resultatet behöver du skapa ett gratis konto på Brave API-sidan och definiera själva funktionen.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Trots att Llama 3.1 är en LLM, har den en begränsning när det gäller multimodalitet. Det vill säga, att kunna använda olika typer av indata som bilder som prompt och ge svar. Denna förmåga är en av huvudfunktionerna i Llama 3.2. Funktionerna inkluderar även:

- Multimodalitet – har möjlighet att utvärdera både text- och bildprompter
- Små till medelstora varianter (11B och 90B) – detta ger flexibla alternativ för distribution,
- Endast text-varianter (1B och 3B) – detta gör att modellen kan användas på edge- och mobila enheter och ger låg fördröjning

Stödet för multimodalitet är ett stort steg framåt inom open source-modeller. Kodexemplet nedan tar både en bild och en textprompt för att få en analys av bilden från Llama 3.2 90B.

### Multimodalt stöd med Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Lärandet slutar inte här, fortsätt resan

När du har slutfört denna lektion, ta en titt på vår [Generative AI Learning collection](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) för att fortsätta utveckla dina kunskaper inom Generativ AI!



---

**Ansvarsfriskrivning**:  
Detta dokument har översatts med hjälp av AI-översättningstjänsten [Co-op Translator](https://github.com/Azure/co-op-translator). Vi strävar efter noggrannhet, men var medveten om att automatiska översättningar kan innehålla fel eller brister. Det ursprungliga dokumentet på dess originalspråk ska betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi tar inget ansvar för eventuella missförstånd eller feltolkningar som uppstår vid användning av denna översättning.
