# LLMs (Large Language Models) là gì?

## Định nghĩa

**LLMs** là viết tắt của **Large Language Models** (Mô hình Ngôn ngữ Lớn) - những mô hình AI được huấn luyện trên lượng văn bản khổng lồ để hiểu và tạo ra ngôn ngữ tự nhiên giống con người.

## Cách hoạt động đơn giản

Hãy tưởng tượng LLMs như một "cỗ máy dự đoán từ cực kỳ thông minh":

1. **Input**: Bạn đưa một câu/đoạn văn
2. **Processing**: Mô hình phân tích ngữ cảnh, mẫu ngôn ngữ
3. **Output**: Dự đoán từ/câu tiếp theo phù hợp nhất

**Ví dụ**: 
- Input: "Hôm nay trời đẹp, tôi muốn đi..."
- LLM dự đoán: "dạo" (xác suất cao), "chơi", "du lịch"...

### "Large" - Lớn ở đâu?

- **Dữ liệu training**: Hàng trăm tỷ từ từ sách, web, báo chí
- **Parameters**: Từ vài tỷ đến hàng trăm tỷ tham số
- **Tính toán**: Cần hàng nghìn GPU, hàng triệu USD để train

### Parameters là gì?

**Parameters** (tham số) là những **con số** mà mô hình học được trong quá trình training. Hãy tưởng tượng parameters như "bộ nhớ" hoặc "kinh nghiệm" của mô hình - chúng lưu trữ tất cả những gì mô hình đã học được về ngôn ngữ.

### Ví dụ đơn giản để hiểu Parameters: Dự đoán giá nhà

Hãy tưởng tượng bạn muốn xây dựng một mô hình AI đơn giản để dự đoán giá nhà dựa trên:
- **Diện tích sàn** (m²)
- **Số tầng**

#### Bước 1: Công thức dự đoán

```
Giá nhà = (Diện tích × W1) + (Số tầng × W2) + B

Trong đó:
- W1, W2 = Weights (trọng số) - ĐÂY LÀ PARAMETERS
- B = Bias (độ lệch) - ĐÂY CŨNG LÀ PARAMETER
```

**Mô hình này có 3 parameters: W1, W2, và B**

#### Training (Học từ dữ liệu), điều chỉnh parameters. Sau hàng nghìn lần điều chỉnh, parameters tối ưu:
```
W1 = 0.045  (mỗi m² tăng giá ~45 triệu)
W2 = 1.2    (mỗi tầng tăng giá ~1.2 tỷ)
B = 0.3     (giá cơ bản ~300 triệu)
```
### Parameters thực chất là gì?

**Weights (Trọng số) - W1, W2**
- Là những con số quyết định "mức độ quan trọng" của mỗi yếu tố
- W1 = 0.045 nghĩa là: 1m² làm tăng giá 45 triệu
- W2 = 1.2 nghĩa là: 1 tầng làm tăng giá 1.2 tỷ

**Bias (Độ lệch) - B**
- Là "giá cơ bản" khi diện tích và số tầng = 0
- Giúp điều chỉnh công thức cho chính xác hơn
- B = 0.3 nghĩa là giá khởi điểm ~300 triệu

**Sự khác biệt:**
- Mô hình giá nhà: 3 parameters
- GPT-2 Small: 124 triệu parameters
- LLaMA 2 7B: 7 tỷ parameters
- GPT-3: 175 tỷ parameters

Càng nhiều parameters → Càng học được nhiều mẫu phức tạp!

### So sánh kích thước mô hình

| Mô hình | Số Parameters | Bộ nhớ cần (fp16) | Đặc điểm |
|---------|---------------|-------------------|----------|
| GPT-2 Small | 124 triệu | ~250 MB | Học tập, thử nghiệm |
| Gemma 2B | 2 tỷ | ~4 GB | Chạy trên laptop |
| Gemma 7B | 7 tỷ | ~14 GB | Chạy trên PC gaming |
| LLaMA 2 70B | 70 tỷ | ~140 GB | Cần GPU mạnh |
| GPT-3 | 175 tỷ | ~350 GB | Data center |
| GPT-4 | ~1.7 nghìn tỷ (ước tính) | ~3.4 TB | Siêu máy tính |


# Understanding Tokens and Context Windows in LLMs

## What are Tokens?

Tokens are the fundamental units that Large Language Models (LLMs) use to process text. Think of them as the "building blocks" of language from the model's perspective.

### Key Characteristics

**Not Always Words**: A token can be:
- A complete word (e.g., "hello")
- Part of a word (e.g., "understand" might be split into "under" + "stand")
- A single character or punctuation mark
- Whitespace or special characters

**Language Dependent**: Different languages tokenize differently:
- English: ~1 token per 4 characters (roughly 0.75 words)
- Other languages: Can require 2-3x more tokens for the same meaning

## What is a Context Window?

The context window is the maximum amount of information (measured in tokens) that an LLM can "see" and process at one time. It's like the model's working memory.

### How It Works

**Input + Output Combined**: The context window includes:
- System prompts and instructions
- Conversation history
- Your current message
- The model's response
- Any retrieved documents or data

**Fixed Limit**: Each model has a specific maximum:
- GPT-3.5: 4K-16K tokens
- GPT-4: 8K-128K tokens
- Claude 3 Opus: 200K tokens
- Claude 3.5 Sonnet: 200K tokens
- Gemini 1.5 Pro: Up to 2M tokens

**Sequential Processing**: Once the limit is reached, older tokens are typically removed (truncated) or the conversation needs to be summarized.

# Let's learn how to talk to AI.
https://learn.deeplearning.ai/courses/chatgpt-prompt-eng/lesson/zi9lz/guidelines

In [33]:
import os
import json
from dotenv import load_dotenv
from openai import OpenAI
from anthropic import Anthropic
from IPython.display import Markdown, display
load_dotenv(override=True)

True

In [34]:
# Create an instance of the OpenAI client
openai = OpenAI()

# Create a test message
messages=[{"role": "user", "content": "How much is SJC gold now?"}]

# Test the OpenAI client
response = openai.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)
print(response.choices[0].message.content)

I'm unable to provide real-time data, including current gold prices. To find the latest price of SJC gold, I recommend checking reliable financial news websites, commodity market platforms, or the official SJC website for the most accurate and updated information.


In [36]:
# Google Gemini Flash gemini-2.0-flash

gemini = OpenAI(api_key=os.getenv('GOOGLE_API_KEY'), base_url="https://generativelanguage.googleapis.com/v1beta/openai/")
model_name = "gemini-2.0-flash"

response = gemini.chat.completions.create(model=model_name, messages=messages)
print(response.choices[0].message.content)

Unfortunately, I don't have access to real-time financial data, including the current price of SJC gold. Gold prices are constantly fluctuating and depend on many factors.

However, here are the best places to find the real-time price of SJC gold:

*   **Reputable Financial Websites:** Major financial websites like **Bloomberg, Reuters, and TradingView** often have real-time gold price information. Look for the specific SJC gold price, as it may be listed separately from the international spot price.
*   **Vietnamese Financial News Sites:** Since SJC gold is specific to Vietnam, local Vietnamese financial news websites will be the most accurate source. Search for sites like **Vietstock.vn, VnExpress, or CafeBiz.**
*   **Directly from SJC:** The official SJC (Saigon Jewelry Company) website is your most reliable source. Look for a section on gold prices, which they usually update regularly.
*   **Local Gold Shops and Jewelers in Vietnam:** If you are in Vietnam, calling or visiting loca

# 🤖 Building Effective AI Agents

*Nguồn: Anthropic Engineering*

---

## 🎯 Agent là gì?

**Workflows:** LLM và tools được điều phối qua code paths định sẵn

**Agents:** LLM tự động điều khiển quy trình và sử dụng tools của chính nó


## 🧱 Building Block: Augmented LLM

![Augmented LLM](https://www-cdn.anthropic.com/images/4zrzovbb/website/d3083d3f40bb2b6f477901cc9a240738d3dd1371-2401x1000.png)

# Retrieval, Tools, Memory

## 📚 Retrieval
**Retrieval** (Truy xuất thông tin) là khả năng của LLM tìm kiếm và lấy thông tin từ nguồn dữ liệu bên ngoài để trả lời câu hỏi chính xác hơn.

### LLM thuần túy có hạn chế:

❌ **Kiến thức cũ**: Chỉ biết đến thời điểm training cutoff (ví dụ: tháng 1/2025)

❌ **Không biết thông tin riêng**: Không biết dữ liệu nội bộ công ty, tài liệu cá nhân

❌ **Hallucination**: Có thể bịa ra thông tin khi không chắc chắn

❌ **Không cập nhật**: Không biết tin tức, sự kiện mới


## 🛠️ Tools
**Tools** (Công cụ) là các functions/APIs mà LLM có thể gọi để thực hiện các hành động cụ thể hoặc lấy thông tin mà nó không thể tự làm được.

**Tools = "Tay và chân" của LLM**, giúp nó tương tác với thế giới bên ngoài.

---
### LLM thuần túy bị giới hạn:

❌ **Chỉ có thể nói chuyện**: Không thể thực hiện hành động thực tế

❌ **Không truy cập dữ liệu real-time**: Không biết giá cổ phiếu, thời tiết hiện tại

❌ **Không tính toán phức tạp**: Math đơn giản ok, nhưng calculations lớn sai

❌ **Không tương tác hệ thống**: Không thể gửi email, tạo file, query database

## 🧠 Memory
**Memory** (Bộ nhớ) là khả năng của LLM ghi nhớ và sử dụng thông tin từ các cuộc hội thoại trước đó hoặc tương tác trong quá khứ.

### LLM thuần túy không nhớ gì:

❌ **Stateless**: Mỗi request là độc lập, không biết request trước

❌ **Không ngữ cảnh**: Không nhớ đã nói gì trong cuộc trò chuyện

❌ **Trải nghiệm kém**: User phải lặp lại thông tin nhiều lần

❌ **Không cá nhân hóa**: Không thể tùy chỉnh theo preferences của user

## Agents mạnh mẽ nhưng cần cực kỳ cẩn thận khi triển khai production!
### 5 vấn đề cốt lõi khi xây dựng Agents:

1. **Unpredictability** - Không biết kết quả sẽ như thế nào
2. **Lack of Control** - Không biết chạy bao lâu, bao nhiêu vòng
3. **Safety Risks** - Nguy hiểm khi autonomous
4. **Unpredictable Cost** - Chi phí không kiểm soát
5. **Goal Misalignment** - Làm sai những gì user muốn

---

## 🔄 5 Workflow Patterns: https://www.anthropic.com/engineering/building-effective-agents

In [20]:
# Of course, we start with law Tech
question = """Identify a specific and high-impact pain point in the Australian legal industry that could be effectively addressed using an Agentic AI solution.
Your response should be formatted in markdown, and must include:
* The pain point (clearly stated)
* An explanation of why it exists and why it's significant
* One or two examples illustrating how it impacts legal professionals or firms"""
messages = [{"role": "user", "content": question}]
response = openai.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)

answer = response.choices[0].message.content
print(answer)


# Pain Point in the Australian Legal Industry: Document Review and Due Diligence

## Pain Point
The legal industry in Australia faces significant challenges with the time-consuming and labor-intensive process of document review and due diligence, particularly in large-scale litigation and mergers and acquisitions.

## Explanation
The document review process is often a bottleneck in legal workflows, primarily due to the sheer volume of documents that need to be analyzed for relevance, privilege, and compliance. This pain point exists for several reasons:

1. **Volume of Data**: With the rise of digital communication and documentation, legal professionals are inundated with vast amounts of data. This includes emails, contracts, and other legal documents that must be meticulously reviewed.

2. **Resource Constraints**: Many law firms operate with limited resources, and the manual review process can be both time-consuming and costly. This often leads to increased billable hours and client 

In [14]:
# Propose the Agentic solution
question = f"""You are an Agentic AI expert.
Based on the following identified problem in the Australian legal industry:
{answer}
Propose at least two Agentic AI-based solutions that could effectively address this issue.
For each proposed solution, include the following details in markdown format:
* Solution name
* Description (how it works)
* Key features or capabilities
* Expected impact (how it solves the problem and benefits the legal industry)"""
messages = [{"role": "user", "content": question}]
response = openai.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)
answer = response.choices[0].message.content
print(answer)

Here are two Agentic AI–based solutions tailored to address the inefficiencies in document review processes within the Australian legal industry:

## Solution 1: SmartDoc Review Assistant

### Description
The SmartDoc Review Assistant leverages natural language processing (NLP) and machine learning algorithms to automate the document review process. By analyzing the content of documents, it categorizes them based on relevance to specific legal cases, allowing legal teams to focus on high-priority documents.

### Key Features or Capabilities
- **AI-Powered Document Categorization**: Uses NLP to analyze the content and context of documents, sorting them into categories for easy access and review.
- **Keyword and Phrase Identification**: Enables legal professionals to set specific keywords and phrases to identify critical documents quickly.
- **Real-Time Collaboration Tools**: Facilitates collaboration among team members by allowing comments, tagging, and assignment of documents or sectio