# Bouwen met de Meta Family-modellen

## Introductie

In deze les behandelen we:

- Een verkenning van de twee belangrijkste Meta Family-modellen - Llama 3.1 en Llama 3.2
- Inzicht in de gebruiksscenario’s en toepassingen van elk model
- Een codevoorbeeld om de unieke eigenschappen van elk model te laten zien

## De Meta Family-modellen

In deze les bekijken we 2 modellen uit de Meta Family, ook wel de "Llama Herd" genoemd - Llama 3.1 en Llama 3.2

Deze modellen zijn er in verschillende varianten en zijn beschikbaar op de Github Model marketplace. Meer informatie over het gebruik van Github Models om te [prototypen met AI-modellen](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Modelvarianten:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Let op: Llama 3 is ook beschikbaar op Github Models, maar wordt in deze les niet behandeld*


## Llama 3.1

Met 405 miljard parameters valt Llama 3.1 in de categorie open source LLM’s.

Deze versie is een upgrade ten opzichte van de eerdere release Llama 3 en biedt:

- Groter contextvenster – 128k tokens tegenover 8k tokens
- Groter maximaal aantal outputtokens – 4096 tegenover 2048
- Betere meertalige ondersteuning – dankzij het grotere aantal trainingstokens

Hierdoor kan Llama 3.1 complexere toepassingen aan bij het bouwen van GenAI-applicaties, waaronder:
- Native Function Calling – de mogelijkheid om externe tools en functies aan te roepen buiten de LLM-werkstroom om
- Betere RAG-prestaties – dankzij het grotere contextvenster
- Genereren van synthetische data – de mogelijkheid om effectieve data te maken voor taken zoals fine-tuning


### Native Function Calling

Llama 3.1 is verder getraind om beter om te gaan met het aanroepen van functies of tools. Het model heeft ook twee ingebouwde tools die het kan herkennen als nodig, afhankelijk van de vraag van de gebruiker. Deze tools zijn:

- **Brave Search** - Kan gebruikt worden om actuele informatie op te zoeken, zoals het weer, door middel van een webzoekopdracht
- **Wolfram Alpha** - Kan ingezet worden voor complexere wiskundige berekeningen, zodat je niet zelf functies hoeft te schrijven.

Je kunt ook je eigen aangepaste tools maken die door de LLM aangeroepen kunnen worden.

In het onderstaande codevoorbeeld:

- Definiëren we de beschikbare tools (brave_search, wolfram_alpha) in de systeem prompt.
- Sturen we een gebruikersvraag over het weer in een bepaalde stad.
- De LLM zal reageren met een tool-aanroep naar de Brave Search tool, wat er zo uit zal zien: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Let op: Dit voorbeeld maakt alleen de tool-aanroep. Als je de resultaten wilt ontvangen, moet je een gratis account aanmaken op de Brave API-pagina en de functie zelf definiëren.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Ondanks dat het een LLM is, heeft Llama 3.1 als beperking dat het niet multimodaal is. Dat wil zeggen, het kan niet verschillende soorten input zoals afbeeldingen als prompt gebruiken en daarop reageren. Deze mogelijkheid is juist een van de belangrijkste kenmerken van Llama 3.2. Deze nieuwe functies zijn onder andere:

- Multimodaliteit - kan zowel tekst- als afbeeldingsprompts verwerken
- Kleine tot middelgrote varianten (11B en 90B) - dit biedt flexibele implementatiemogelijkheden,
- Alleen-tekst varianten (1B en 3B) - hiermee kan het model op edge- of mobiele apparaten draaien en zorgt het voor lage vertraging

De ondersteuning voor multimodaliteit is een grote stap in de wereld van open source modellen. In het onderstaande codevoorbeeld wordt zowel een afbeelding als een tekstprompt gebruikt om een analyse van de afbeelding te krijgen van Llama 3.2 90B.

### Multimodale ondersteuning met Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Leren stopt hier niet, ga verder met de reis

Na het afronden van deze les, bekijk onze [Generative AI Learning collectie](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) om je kennis over Generative AI verder uit te breiden!



---

**Disclaimer**:
Dit document is vertaald met behulp van de AI-vertalingsdienst [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u er rekening mee te houden dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet als de gezaghebbende bron worden beschouwd. Voor kritische informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
