# Membina Dengan Model Keluarga Meta

## Pengenalan

Pelajaran ini akan merangkumi:

- Meneroka dua model utama dalam keluarga Meta - Llama 3.1 dan Llama 3.2
- Memahami kegunaan dan senario untuk setiap model
- Contoh kod untuk menunjukkan ciri unik setiap model

## Keluarga Model Meta

Dalam pelajaran ini, kita akan meneroka 2 model daripada keluarga Meta atau "Llama Herd" - Llama 3.1 dan Llama 3.2

Model-model ini hadir dalam beberapa varian dan boleh didapati di pasaran Model Github. Berikut adalah maklumat lanjut tentang menggunakan Github Models untuk [membina prototaip dengan model AI](https://docs.github.com/en/github-models/prototyping-with-ai-models?WT.mc_id=academic-105485-koreyst).

Varian Model:
- Llama 3.1 - 70B Instruct
- Llama 3.1 - 405B Instruct
- Llama 3.2 - 11B Vision Instruct
- Llama 3.2 - 90B Vision Instruct

*Nota: Llama 3 juga tersedia di Github Models tetapi tidak akan dibincangkan dalam pelajaran ini*


## Llama 3.1

Dengan 405 Bilion Parameter, Llama 3.1 tergolong dalam kategori LLM sumber terbuka.

Model ini merupakan peningkatan daripada keluaran Llama 3 sebelum ini dengan menawarkan:

- Tetingkap konteks yang lebih besar - 128k token berbanding 8k token
- Maksimum Output Token yang lebih tinggi - 4096 berbanding 2048
- Sokongan pelbagai bahasa yang lebih baik - hasil daripada peningkatan jumlah token latihan

Ciri-ciri ini membolehkan Llama 3.1 menangani kes penggunaan yang lebih kompleks semasa membina aplikasi GenAI termasuk:
- Panggilan Fungsi Asli - keupayaan untuk memanggil alat dan fungsi luaran di luar aliran kerja LLM
- Prestasi RAG yang lebih baik - disebabkan tetingkap konteks yang lebih besar
- Penjanaan Data Sintetik - keupayaan untuk menghasilkan data yang berkesan untuk tugasan seperti penalaan lanjut


### Panggilan Fungsi Asli

Llama 3.1 telah ditala dengan lebih baik untuk menjadi lebih berkesan dalam membuat panggilan fungsi atau alat. Ia juga mempunyai dua alat terbina dalam yang boleh dikenal pasti oleh model sebagai perlu digunakan berdasarkan arahan daripada pengguna. Alat-alat ini ialah:

- **Brave Search** - Boleh digunakan untuk mendapatkan maklumat terkini seperti cuaca dengan melakukan carian web
- **Wolfram Alpha** - Boleh digunakan untuk pengiraan matematik yang lebih kompleks jadi anda tidak perlu menulis fungsi sendiri.

Anda juga boleh mencipta alat tersuai anda sendiri yang boleh dipanggil oleh LLM.

Dalam contoh kod di bawah:

- Kita tetapkan alat yang tersedia (brave_search, wolfram_alpha) dalam arahan sistem.
- Hantar arahan pengguna yang bertanya tentang cuaca di sebuah bandar tertentu.
- LLM akan membalas dengan panggilan alat kepada alat Brave Search yang akan kelihatan seperti ini `<|python_tag|>brave_search.call(query="Stockholm weather")`

*Nota: Contoh ini hanya membuat panggilan alat, jika anda ingin mendapatkan hasilnya, anda perlu mencipta akaun percuma di laman API Brave dan tetapkan fungsi itu sendiri*


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)





### Llama 3.2

Walaupun Llama 3.1 adalah sebuah LLM, salah satu kekurangannya ialah multimodaliti. Maksudnya, keupayaan untuk menggunakan pelbagai jenis input seperti imej sebagai arahan dan memberikan respons. Keupayaan ini merupakan salah satu ciri utama Llama 3.2. Ciri-ciri ini juga merangkumi:

- Multimodaliti - mempunyai keupayaan untuk menilai kedua-dua arahan teks dan imej
- Variasi saiz Kecil hingga Sederhana (11B dan 90B) - ini memberikan pilihan pelaksanaan yang fleksibel,
- Variasi hanya-teks (1B dan 3B) - ini membolehkan model digunakan pada peranti edge / mudah alih dan memberikan kependaman yang rendah

Sokongan multimodal ini merupakan satu langkah besar dalam dunia model sumber terbuka. Contoh kod di bawah menggunakan kedua-dua imej dan arahan teks untuk mendapatkan analisis imej daripada Llama 3.2 90B.

### Sokongan Multimodal dengan Llama 3.2


In [None]:
%pip install azure-core
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"


client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

## Pembelajaran tidak berhenti di sini, teruskan Perjalanan Anda

Selepas menamatkan pelajaran ini, lawati [koleksi Pembelajaran AI Generatif](https://aka.ms/genai-collection?WT.mc_id=academic-105485-koreyst) kami untuk terus meningkatkan pengetahuan anda tentang AI Generatif!



---

**Penafian**:  
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Walaupun kami berusaha untuk memastikan ketepatan, sila maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang sah. Untuk maklumat penting, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.
