## Nhập Thư Viện Cần Thiết
Nhập các thư viện PyTorch và transformers cần thiết để tải và sử dụng mô hình Phi-4.


In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

## Đặt Hạt Giống Ngẫu Nhiên
Đặt hạt giống ngẫu nhiên để đảm bảo kết quả có thể tái lập qua các lần chạy khác nhau.


In [None]:
torch.random.manual_seed(0)

## Tải Mô Hình và Tokenizer Phi-4-mini-flash-reasoning
Tải mô hình Microsoft Phi-4-mini-flash-reasoning và tokenizer tương ứng từ Hugging Face. Mô hình sẽ được tải lên CUDA để suy luận nhanh hơn.


In [None]:
model_id = "microsoft/Phi-4-mini-flash-reasoning"
model = AutoModelForCausalLM.from_pretrained(
   model_id,
   device_map="cuda",
   torch_dtype="auto",
   trust_remote_code=True,
)
tokenizer = AutoTokenizer.from_pretrained(model_id)

## Chuẩn bị Tin nhắn Đầu vào
Tạo một tin nhắn hội thoại với một bài toán phương trình bậc hai và định dạng nó bằng mẫu trò chuyện cho mô hình.


In [None]:
messages = [{
   "role": "user",
   "content": "How to solve 3*x^2+4*x+5=1?"
}]   
inputs = tokenizer.apply_chat_template(
   messages,
   add_generation_prompt=True,
   return_dict=True,
   return_tensors="pt",
)

## Tạo Phản Hồi
Tạo phản hồi từ mô hình bằng cách sử dụng các tham số được chỉ định như nhiệt độ và top_p để kiểm soát mức độ ngẫu nhiên trong kết quả đầu ra.


In [None]:
outputs = model.generate(
   **inputs.to(model.device),
   max_new_tokens=32768,
   temperature=0.6,
   top_p=0.95,
   do_sample=True,
)

## Giải mã đầu ra thành văn bản
Chuyển đổi các chuỗi token được tạo thành văn bản dễ đọc, loại bỏ các token đầu vào ban đầu để chỉ hiển thị phản hồi của mô hình.


In [None]:
outputs = tokenizer.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])


---

**Tuyên bố miễn trừ trách nhiệm**:  
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI [Co-op Translator](https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp bởi con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này.
