# Costruire con i modelli della famiglia Meta

## Introduzione

Questa lezione coprirà:

- Esplorare i due principali modelli della famiglia Meta - Llama 3.1 e Llama 3.2
- Comprendere i casi d’uso e gli scenari per ciascun modello
- Esempio di codice per mostrare le caratteristiche uniche di ogni modello

## La famiglia di modelli Meta

In questa lezione esploreremo 2 modelli della famiglia Meta, o “Llama Herd” - Llama 3.1 e Llama 3.2

Questi modelli sono disponibili in diverse varianti e si trovano sul marketplace dei modelli di Github. Qui trovi maggiori dettagli su come usare i modelli Github per [prototipare con modelli AI](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Varianti dei modelli:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Nota: Llama 3 è disponibile anche su Github Models ma non verrà trattato in questa lezione*


## Llama 3.1

Con 405 miliardi di parametri, Llama 3.1 rientra nella categoria degli LLM open source.

Il modello è un aggiornamento rispetto alla versione precedente Llama 3 offrendo:

- Finestra di contesto più ampia - 128k token contro 8k token
- Maggior numero massimo di token in output - 4096 contro 2048
- Miglior supporto multilingue - grazie all’aumento dei token di addestramento

Queste caratteristiche permettono a Llama 3.1 di gestire casi d’uso più complessi nella creazione di applicazioni GenAI, tra cui:
- Native Function Calling - la possibilità di richiamare strumenti e funzioni esterne al flusso di lavoro dell’LLM
- Migliori prestazioni RAG - grazie alla finestra di contesto più ampia
- Generazione di dati sintetici - la capacità di creare dati efficaci per attività come il fine-tuning


### Chiamata Nativa alle Funzioni

Llama 3.1 è stato ottimizzato per essere più efficace nell’effettuare chiamate a funzioni o strumenti. Dispone anche di due strumenti integrati che il modello può riconoscere come necessari in base alla richiesta dell’utente. Questi strumenti sono:

- **Brave Search** - Può essere utilizzato per ottenere informazioni aggiornate come il meteo effettuando una ricerca sul web
- **Wolfram Alpha** - Può essere utilizzato per calcoli matematici più complessi, così non è necessario scrivere le proprie funzioni.

Puoi anche creare i tuoi strumenti personalizzati che l’LLM può richiamare.

Nell’esempio di codice qui sotto:

- Definiamo gli strumenti disponibili (brave_search, wolfram_alpha) nel prompt di sistema.
- Inviamo un prompt utente che chiede informazioni sul meteo in una certa città.
- L’LLM risponderà con una chiamata allo strumento Brave Search che apparirà così `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Nota: Questo esempio effettua solo la chiamata allo strumento; se desideri ottenere i risultati, dovrai creare un account gratuito sulla pagina delle API di Brave e definire la funzione stessa*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Nonostante sia un LLM, una delle limitazioni di Llama 3.1 è la multimodalità. Ovvero, la capacità di utilizzare diversi tipi di input come immagini come prompt e fornire risposte. Questa funzionalità è una delle principali novità di Llama 3.2. Queste caratteristiche includono anche:

- Multimodalità - ha la capacità di valutare sia prompt testuali che immagini
- Varianti di dimensioni piccole e medie (11B e 90B) - questo offre opzioni di implementazione flessibili,
- Varianti solo testo (1B e 3B) - questo permette al modello di essere utilizzato su dispositivi edge / mobili e garantisce bassa latenza

Il supporto multimodale rappresenta un grande passo avanti nel mondo dei modelli open source. L’esempio di codice qui sotto accetta sia un’immagine che un prompt testuale per ottenere un’analisi dell’immagine da Llama 3.2 90B.

### Supporto multimodale con Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## L'apprendimento non si ferma qui, continua il tuo percorso

Dopo aver completato questa lezione, dai un'occhiata alla nostra [collezione di apprendimento sull'IA generativa](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) per continuare a migliorare le tue conoscenze sull'IA generativa!



---

**Disclaimer**:  
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Pur impegnandoci per garantire l’accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa deve essere considerato la fonte autorevole. Per informazioni di carattere critico, si raccomanda una traduzione professionale eseguita da un essere umano. Non siamo responsabili per eventuali malintesi o interpretazioni errate derivanti dall’uso di questa traduzione.
