# Rad s Meta obitelji modela

## Uvod

Ova lekcija pokriva:

- Istraživanje dva glavna modela iz Meta obitelji - Llama 3.1 i Llama 3.2
- Razumijevanje primjene i scenarija za svaki model
- Primjer koda koji prikazuje jedinstvene značajke svakog modela

## Meta obitelj modela

U ovoj lekciji istražit ćemo 2 modela iz Meta obitelji ili "Llama stada" - Llama 3.1 i Llama 3.2

Ovi modeli dolaze u različitim varijantama i dostupni su na Github Model marketplaceu. Više informacija o korištenju Github Modela za [prototipiranje s AI modelima](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Varijante modela:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Napomena: Llama 3 je također dostupna na Github Modelima, ali neće biti obrađena u ovoj lekciji*


## Llama 3.1

Sa 405 milijardi parametara, Llama 3.1 spada u kategoriju otvorenih LLM modela.

Ova verzija je nadogradnja na prethodnu Llama 3 i donosi:

- Veći kontekstni prozor – 128k tokena naspram 8k tokena
- Veći maksimalni broj izlaznih tokena – 4096 naspram 2048
- Bolja podrška za više jezika – zahvaljujući većem broju tokena u treningu

Ove značajke omogućuju Llama 3.1 da se nosi s kompleksnijim slučajevima upotrebe pri izradi GenAI aplikacija, uključujući:
- Izvorno pozivanje funkcija – mogućnost pozivanja vanjskih alata i funkcija izvan LLM tijeka rada
- Bolje RAG performanse – zahvaljujući većem kontekstnom prozoru
- Generiranje sintetičkih podataka – mogućnost stvaranja učinkovitih podataka za zadatke poput fine-tuninga


### Pozivanje izvornih funkcija

Llama 3.1 je dodatno prilagođena kako bi bila učinkovitija u pozivanju funkcija ili alata. Također ima dva ugrađena alata koje model može prepoznati kao potrebne za korištenje na temelju korisničkog upita. Ti alati su:

- **Brave Search** - Može se koristiti za dobivanje najnovijih informacija poput vremenske prognoze putem pretraživanja interneta
- **Wolfram Alpha** - Može se koristiti za složenije matematičke izračune pa nije potrebno pisati vlastite funkcije.

Možete također kreirati vlastite prilagođene alate koje LLM može pozivati.

U donjem primjeru koda:

- Definiramo dostupne alate (brave_search, wolfram_alpha) u sistemskom upitu.
- Šaljemo korisnički upit koji pita za vremensku prognozu u određenom gradu.
- LLM će odgovoriti pozivom alata Brave Search koji će izgledati ovako `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Napomena: Ovaj primjer samo poziva alat, a ako želite dobiti rezultate, potrebno je otvoriti besplatan račun na Brave API stranici i definirati samu funkciju*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Iako je Llama 3.1 veliki jezični model, jedno od njegovih ograničenja je multimodalnost. To znači mogućnost korištenja različitih vrsta ulaza, poput slika, kao upita i davanja odgovora. Ova mogućnost je jedna od glavnih značajki Llama 3.2. Te značajke uključuju:

- Multimodalnost - ima mogućnost obrade i tekstualnih i slikovnih upita
- Varijante male do srednje veličine (11B i 90B) - to omogućuje fleksibilne opcije implementacije,
- Varijante samo za tekst (1B i 3B) - to omogućuje modelu da se koristi na rubnim / mobilnim uređajima i pruža nisku latenciju

Podrška za multimodalnost predstavlja veliki korak u svijetu open source modela. Primjer koda ispod koristi i sliku i tekstualni upit kako bi dobio analizu slike od Llama 3.2 90B.

### Multimodalna podrška s Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Učenje ne prestaje ovdje, nastavi svoje putovanje

Nakon što završiš ovu lekciju, pogledaj našu [Generative AI Learning kolekciju](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) i nastavi usavršavati svoje znanje o generativnoj umjetnoj inteligenciji!



---

**Odricanje od odgovornosti**:  
Ovaj dokument je preveden pomoću AI usluge prevođenja [Co-op Translator](https://github.com/Azure/co-op-translator). Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati mjerodavnim izvorom. Za ključne informacije preporučuje se profesionalni ljudski prijevod. Ne snosimo odgovornost za bilo kakva nesporazume ili pogrešna tumačenja koja proizlaze iz korištenja ovog prijevoda.
