# Χτίζοντας με τα μοντέλα της οικογένειας Meta

## Εισαγωγή

Σε αυτό το μάθημα θα καλύψουμε:

- Εξερεύνηση των δύο βασικών μοντέλων της οικογένειας Meta - Llama 3.1 και Llama 3.2
- Κατανόηση των περιπτώσεων χρήσης και των σεναρίων για κάθε μοντέλο
- Παράδειγμα κώδικα που δείχνει τα μοναδικά χαρακτηριστικά κάθε μοντέλου

## Η οικογένεια μοντέλων Meta

Σε αυτό το μάθημα, θα εξερευνήσουμε 2 μοντέλα από την οικογένεια Meta ή το "Llama Herd" - Llama 3.1 και Llama 3.2

Αυτά τα μοντέλα διατίθενται σε διάφορες παραλλαγές και είναι διαθέσιμα στο marketplace μοντέλων του Github. Εδώ θα βρείτε περισσότερες πληροφορίες για το πώς να χρησιμοποιήσετε τα Github Models για [πρωτοτυποποίηση με μοντέλα AI](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Παραλλαγές μοντέλων:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Σημείωση: Το Llama 3 είναι επίσης διαθέσιμο στα Github Models αλλά δεν θα καλυφθεί σε αυτό το μάθημα*


## Llama 3.1

Με 405 δισεκατομμύρια παραμέτρους, το Llama 3.1 ανήκει στην κατηγορία των ανοιχτού κώδικα LLM.

Η έκδοση αυτή αποτελεί αναβάθμιση σε σχέση με το προηγούμενο Llama 3 προσφέροντας:

- Μεγαλύτερο παράθυρο συμφραζομένων - 128k tokens έναντι 8k tokens
- Μεγαλύτερο μέγιστο αριθμό εξόδου tokens - 4096 έναντι 2048
- Καλύτερη υποστήριξη πολλαπλών γλωσσών - λόγω της αύξησης των tokens εκπαίδευσης

Αυτά επιτρέπουν στο Llama 3.1 να διαχειρίζεται πιο σύνθετες περιπτώσεις χρήσης κατά την ανάπτυξη εφαρμογών GenAI, όπως:

- Ενσωματωμένη κλήση συναρτήσεων - η δυνατότητα να καλεί εξωτερικά εργαλεία και συναρτήσεις εκτός της ροής εργασίας του LLM
- Καλύτερη απόδοση RAG - χάρη στο μεγαλύτερο παράθυρο συμφραζομένων
- Δημιουργία συνθετικών δεδομένων - η δυνατότητα δημιουργίας αποτελεσματικών δεδομένων για εργασίες όπως το fine-tuning


### Κλήση Ενσωματωμένων Συναρτήσεων

Το Llama 3.1 έχει βελτιωθεί ώστε να είναι πιο αποτελεσματικό στη χρήση συναρτήσεων ή εργαλείων. Διαθέτει επίσης δύο ενσωματωμένα εργαλεία που το μοντέλο μπορεί να αναγνωρίσει ότι χρειάζεται να χρησιμοποιηθούν, ανάλογα με το αίτημα του χρήστη. Αυτά τα εργαλεία είναι:

- **Brave Search** - Μπορεί να χρησιμοποιηθεί για να λαμβάνετε ενημερωμένες πληροφορίες, όπως ο καιρός, μέσω αναζήτησης στο διαδίκτυο
- **Wolfram Alpha** - Μπορεί να χρησιμοποιηθεί για πιο σύνθετους μαθηματικούς υπολογισμούς, ώστε να μην χρειάζεται να γράψετε δικές σας συναρτήσεις.

Μπορείτε επίσης να δημιουργήσετε τα δικά σας προσαρμοσμένα εργαλεία που το LLM μπορεί να καλεί.

Στο παρακάτω παράδειγμα κώδικα:

- Ορίζουμε τα διαθέσιμα εργαλεία (brave_search, wolfram_alpha) στο σύστημα prompt.
- Στέλνουμε ένα αίτημα χρήστη που ρωτά για τον καιρό σε μια συγκεκριμένη πόλη.
- Το LLM θα απαντήσει με μια κλήση εργαλείου προς το Brave Search, η οποία θα μοιάζει κάπως έτσι: `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Σημείωση: Το παράδειγμα αυτό κάνει μόνο την κλήση του εργαλείου. Αν θέλετε να λάβετε τα αποτελέσματα, θα χρειαστεί να δημιουργήσετε έναν δωρεάν λογαριασμό στη σελίδα του Brave API και να ορίσετε τη συνάρτηση μόνοι σας.*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Παρόλο που είναι ένα LLM, ένας περιορισμός που έχει το Llama 3.1 είναι η πολυτροπικότητα. Δηλαδή, η δυνατότητα να χρησιμοποιεί διαφορετικούς τύπους εισόδου όπως εικόνες ως προτροπές και να παρέχει απαντήσεις. Αυτή η δυνατότητα είναι ένα από τα βασικά χαρακτηριστικά του Llama 3.2. Αυτά τα χαρακτηριστικά περιλαμβάνουν επίσης:

- Πολυτροπικότητα - έχει τη δυνατότητα να αξιολογεί τόσο κείμενο όσο και εικόνες ως προτροπές
- Παραλλαγές μικρού έως μεσαίου μεγέθους (11B και 90B) - αυτό προσφέρει ευέλικτες επιλογές ανάπτυξης,
- Παραλλαγές μόνο κειμένου (1B και 3B) - αυτό επιτρέπει στο μοντέλο να αναπτυχθεί σε edge / κινητές συσκευές και προσφέρει χαμηλή καθυστέρηση

Η υποστήριξη πολυτροπικότητας αποτελεί ένα σημαντικό βήμα στον κόσμο των μοντέλων ανοιχτού κώδικα. Το παρακάτω παράδειγμα κώδικα δέχεται τόσο μια εικόνα όσο και μια προτροπή κειμένου για να λάβει ανάλυση της εικόνας από το Llama 3.2 90B.

### Υποστήριξη Πολυτροπικότητας με το Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Η μάθηση δεν σταματά εδώ, συνέχισε το ταξίδι

Αφού ολοκληρώσεις αυτό το μάθημα, δες τη [συλλογή εκμάθησης Generative AI](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) για να συνεχίσεις να αναβαθμίζεις τις γνώσεις σου στη Generative AI!



---

**Αποποίηση Ευθύνης**:  
Αυτό το έγγραφο έχει μεταφραστεί χρησιμοποιώντας την υπηρεσία αυτόματης μετάφρασης AI [Co-op Translator](https://github.com/Azure/co-op-translator). Παρόλο που καταβάλλουμε προσπάθειες για ακρίβεια, παρακαλούμε να γνωρίζετε ότι οι αυτόματες μεταφράσεις ενδέχεται να περιέχουν λάθη ή ανακρίβειες. Το πρωτότυπο έγγραφο στη μητρική του γλώσσα θα πρέπει να θεωρείται η αυθεντική πηγή. Για κρίσιμες πληροφορίες, συνιστάται επαγγελματική ανθρώπινη μετάφραση. Δεν φέρουμε ευθύνη για τυχόν παρανοήσεις ή εσφαλμένες ερμηνείες που προκύπτουν από τη χρήση αυτής της μετάφρασης.
