# Arbeiten mit den Meta-Familienmodellen

## Einführung

In dieser Lektion behandeln wir:

- Die beiden Hauptmodelle der Meta-Familie – Llama 3.1 und Llama 3.2
- Die Anwendungsfälle und Einsatzszenarien für jedes Modell
- Ein Codebeispiel, das die besonderen Merkmale jedes Modells zeigt

## Die Meta-Modellfamilie

In dieser Lektion schauen wir uns zwei Modelle aus der Meta-Familie oder dem „Llama Herd“ an – Llama 3.1 und Llama 3.2

Diese Modelle gibt es in verschiedenen Varianten und sie sind auf dem Github Model Marketplace verfügbar. Weitere Informationen zur Nutzung von Github Models zum [Prototyping mit KI-Modellen](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst) findest du hier.

Modellvarianten:
- Llama 3.1 – 70B Instruct
- Llama 3.1 – 405B Instruct
- Llama 3.2 – 11B Vision Instruct
- Llama 3.2 – 90B Vision Instruct

*Hinweis: Llama 3 ist ebenfalls auf Github Models verfügbar, wird aber in dieser Lektion nicht behandelt*


## Llama 3.1

Mit 405 Milliarden Parametern gehört Llama 3.1 zur Kategorie der Open-Source-LLMs.

Das Modell ist ein Upgrade zur früheren Version Llama 3 und bietet:

- Größeres Kontextfenster – 128k Token statt 8k Token
- Höhere maximale Ausgabetoken – 4096 statt 2048
- Bessere mehrsprachige Unterstützung – durch die erhöhte Anzahl an Trainingstoken

Dadurch kann Llama 3.1 komplexere Anwendungsfälle bei der Entwicklung von GenAI-Anwendungen bewältigen, darunter:
- Native Function Calling – die Möglichkeit, externe Tools und Funktionen außerhalb des LLM-Workflows aufzurufen
- Bessere RAG-Performance – dank des größeren Kontextfensters
- Generierung synthetischer Daten – die Fähigkeit, effektive Daten für Aufgaben wie das Finetuning zu erstellen


### Native Function Calling

Llama 3.1 wurde darauf optimiert, Funktionen oder Tools effektiver aufzurufen. Das Modell verfügt außerdem über zwei integrierte Tools, die es je nach Nutzeranfrage als notwendig erkennen kann. Diese Tools sind:

- **Brave Search** – Kann verwendet werden, um aktuelle Informationen wie das Wetter über eine Websuche zu erhalten
- **Wolfram Alpha** – Kann für komplexere mathematische Berechnungen genutzt werden, sodass eigene Funktionen nicht nötig sind.

Du kannst auch eigene benutzerdefinierte Tools erstellen, die das LLM aufrufen kann.

Im folgenden Codebeispiel:

- Definieren wir die verfügbaren Tools (brave_search, wolfram_alpha) im System-Prompt.
- Senden eine Nutzeranfrage, die nach dem Wetter in einer bestimmten Stadt fragt.
- Das LLM antwortet mit einem Tool-Aufruf für Brave Search, der so aussieht: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Hinweis: Dieses Beispiel führt nur den Tool-Aufruf aus. Wenn du die Ergebnisse erhalten möchtest, musst du ein kostenloses Konto auf der Brave API-Seite erstellen und die Funktion selbst definieren.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Trotz der Tatsache, dass Llama 3.1 ein LLM ist, hat es eine Einschränkung im Bereich der Multimodalität. Das bedeutet, dass es nicht in der Lage ist, verschiedene Eingabetypen wie Bilder als Prompts zu verwenden und darauf zu antworten. Diese Fähigkeit ist eines der Hauptmerkmale von Llama 3.2. Zu diesen Funktionen gehören außerdem:

- Multimodalität – kann sowohl Text- als auch Bild-Prompts auswerten
- Varianten in kleiner bis mittlerer Größe (11B und 90B) – dies ermöglicht flexible Einsatzmöglichkeiten,
- Nur-Text-Varianten (1B und 3B) – dadurch kann das Modell auf Edge- oder Mobilgeräten eingesetzt werden und bietet geringe Latenz

Die multimodale Unterstützung stellt einen großen Fortschritt in der Welt der Open-Source-Modelle dar. Das folgende Codebeispiel nimmt sowohl ein Bild als auch einen Text-Prompt, um eine Analyse des Bildes von Llama 3.2 90B zu erhalten.

### Multimodale Unterstützung mit Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Lernen hört hier nicht auf, setze deine Reise fort

Nachdem du diese Lektion abgeschlossen hast, schau dir unsere [Generative AI Learning collection](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) an, um dein Wissen über Generative KI weiter auszubauen!



---

**Haftungsausschluss**:  
Dieses Dokument wurde mit dem KI-Übersetzungsdienst [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner Ausgangssprache gilt als maßgebliche Quelle. Für wichtige Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
