# Construirea cu modelele din familia Meta

## Introducere

Această lecție va acoperi:

- Explorarea celor două modele principale din familia Meta - Llama 3.1 și Llama 3.2
- Înțelegerea scenariilor și a cazurilor de utilizare pentru fiecare model
- Exemplu de cod pentru a evidenția caracteristicile unice ale fiecărui model

## Familia de modele Meta

În această lecție, vom explora 2 modele din familia Meta sau „Llama Herd” - Llama 3.1 și Llama 3.2

Aceste modele vin în variante diferite și sunt disponibile pe piața de modele Github. Găsești mai multe detalii despre folosirea Github Models pentru a [prototipa cu modele AI](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Variante de model:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Notă: Llama 3 este disponibil și pe Github Models, dar nu va fi acoperit în această lecție*


## Llama 3.1

Cu 405 miliarde de parametri, Llama 3.1 se încadrează în categoria LLM open source.

Acest model este o îmbunătățire față de versiunea anterioară Llama 3, oferind:

- Fereastră de context mai mare - 128k tokeni față de 8k tokeni
- Număr maxim de tokeni generați mai mare - 4096 față de 2048
- Suport multilingv mai bun - datorită creșterii numărului de tokeni folosiți la antrenare

Aceste îmbunătățiri permit Llama 3.1 să gestioneze cazuri de utilizare mai complexe atunci când se construiesc aplicații GenAI, inclusiv:
- Apelare nativă de funcții - posibilitatea de a apela instrumente și funcții externe în afara fluxului de lucru al LLM-ului
- Performanță RAG îmbunătățită - datorită ferestrei de context mai mari
- Generare de date sintetice - capacitatea de a crea date eficiente pentru sarcini precum fine-tuning


### Apelarea nativă a funcțiilor

Llama 3.1 a fost ajustat pentru a fi mai eficient la efectuarea de apeluri către funcții sau instrumente. De asemenea, are două instrumente integrate pe care modelul le poate identifica ca fiind necesare, în funcție de cererea utilizatorului. Aceste instrumente sunt:

- **Brave Search** – Poate fi folosit pentru a obține informații actualizate, cum ar fi vremea, printr-o căutare pe web
- **Wolfram Alpha** – Poate fi folosit pentru calcule matematice mai complexe, astfel încât nu este nevoie să scrii propriile funcții.

Poți crea și propriile tale instrumente personalizate pe care LLM le poate apela.

În exemplul de cod de mai jos:

- Definim instrumentele disponibile (brave_search, wolfram_alpha) în promptul de sistem.
- Trimitem un prompt de la utilizator care întreabă despre vremea dintr-un anumit oraș.
- LLM va răspunde cu un apel către instrumentul Brave Search, care va arăta astfel: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Notă: Acest exemplu doar face apelul către instrument; dacă vrei să obții rezultatele, va trebui să îți creezi un cont gratuit pe pagina Brave API și să definești funcția propriu-zisă*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Deși este un LLM, una dintre limitările pe care le are Llama 3.1 este multimodalitatea. Mai exact, capacitatea de a folosi diferite tipuri de input, cum ar fi imaginile, ca prompturi și de a oferi răspunsuri. Această abilitate este una dintre principalele caracteristici ale Llama 3.2. Aceste funcționalități includ și:

- Multimodalitate – are capacitatea de a evalua atât prompturi text, cât și imagini
- Variante de dimensiuni mici și medii (11B și 90B) – oferă opțiuni flexibile de implementare,
- Variante doar text (1B și 3B) – permit modelului să fie implementat pe dispozitive edge sau mobile și asigură latență redusă

Suportul multimodal reprezintă un pas important în lumea modelelor open source. Exemplul de cod de mai jos folosește atât o imagine, cât și un prompt text pentru a obține o analiză a imaginii de la Llama 3.2 90B.

### Suport multimodal cu Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Învățarea nu se oprește aici, continuă-ți drumul

După ce ai terminat această lecție, aruncă o privire la [colecția noastră de învățare despre AI generativă](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) pentru a-ți dezvolta în continuare cunoștințele despre AI generativă!



---

**Declinarea responsabilității**:
Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși depunem eforturi pentru acuratețe, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original, în limba sa nativă, trebuie considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de oameni. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea în urma utilizării acestei traduceri.
