# 1 số khái niệm
- Artifact : bất kỳ tệp, thành phần hoặc kết quả trung gian được sinh ra trong quá trình phát triển phần mềm hoặc mô hình machine learning. Ví dụ: file build, package, docker images, ...

# Định nghĩa
- MLOps là phương pháp kết hợp giữa machine learning với các 
nguyên tắc DevOps
- nhằm tự động hóa và tối ưu toàn bộ vòng đời của mô hình ML
- Mục tiêu chính là giúp quy trình ML trở nên trơn tru, nhanh chóng và hiệu quả hơn
# Lợi ích
- Scalability : giúp các mô hình machine learning có thể mở rộng linh hoạt trên nhiều môi trường khác nhau : local, cloud, edge device
- Reproducibility (Khả năng tái lập) : đảm bảo các mô hình và pipeline dữ liệu có thể được tái lập chính xác như khi phát triển => tính  nhất quán giữa dev, test, product
- Automation : tự động hóa nhiều công việc lặp đi lặp lại như retraining, testing, deployment, monitoring
- Model Lifecycle Management
- Collaboration
# Key concept
- Versioning :
    - Data Versioning : theo dõi version của training data, test data
    - Model Versioning
    - Code versioning: ví dụ Git
- Automation 
    - Auto training với dữ liệu mới
    - CI/CD
- Monitoring
    - Giám sát hiệu suất mô hình
- Concept Drift Detection (Phát hiện sai lệch dữ liệu)
    - Theo dõi khi mô hình bắt đầu hoạt động kém đi do sự thay đổi trong phân bố dữ liệu theo thời gian.
- Logging:
    - Thu thập các log liên quan đến việc suy luận mô hình, hiệu suất hệ thống và các lỗi, phục vụ mục đích gỡ lỗi và kiểm toán.
# MLOps và DevOps
- Giống:
    - Automation 
    - Collaboration : dev, test, product
    - CI/CD Pipelines
- Khác:
    - Độ phức tạp của artifacts :
        - DevOps chủ yếu quản lý mã nguồn phần mềm.
        - MLOps phải quản lý thêm dữ liệu huấn luyện, các mô hình machine learning và cả mã nguồn
    - Yếu tố thử nghiệm:
        - MLOps nhấn mạnh vào thử nghiệm: điều chỉnh siêu tham số (hyperparameters), lựa chọn kiến trúc mô hình, v.v.
        - DevOps ít chú trọng đến thử nghiệm so với MLOps vì sản phẩm phần mềm thường ổn định hơn khi triển khai.
    - Nhu cầu giám sát:
        - MLOps cần giám sát hiệu suất mô hình và phát hiện sai lệch dữ liệu (concept drift).
    - ...

# Bài thực hành
- Xây dựng một cấu trúc dự án MLOps cơ bản, bao gồm các thành phần: versioning, automation , monitoring 
-  Toàn bộ bài thực hành gồm 4 bước:
    - Thiết lập version control với Git
    - Cấu hình Docker để container hóa
        - ```docker init``` để khởi tạo 1 số file
    - Thực hiện tracking thí nghiệm cơ bản với MLflow
        - MLflow được sử dụng để ghi nhận và quản lý các thực nghiệm ML, lưu lại thông tin về mô hình, dữ liệu, tham số, và kết quả đánh giá.
        - Mục tiêu: sau khi training mô hình, tự động log lại các metric (ví dụ: accuracy) vào hệ thống MLflow.
    - Thiết lập hệ thống monitoring cơ bản


# Experimentation vs Production

| Experimentation                                               | Production                                                |
| ------------------------------------------------------------- | --------------------------------------------------------- |
| 🧪 Sử dụng Jupyter Notebook, Scikit-learn, TensorFlow (local) | ⚙️ Sử dụng Kubeflow, MLflow, TFX để xây dựng pipeline lớn |
| 📄 Dữ liệu nhỏ, xử lý trên máy cá nhân                        | 🌐 Dữ liệu lớn, xử lý trên hệ thống phân tán hoặc cloud   |
| ✍️ Versioning thủ công, lưu trữ rải rác                       | 🔄 Quản lý version tự động, có quy trình CI/CD            |

## 2️⃣ Mục tiêu của từng giai đoạn
- Experimentation:
    - Khám phá dữ liệu
    - Kiểm thử mô hình
    - Thử nghiệm đặc trưng (feature engineering)
    - Xây dựng prototype nhanh

- Production:
    - Đảm bảo độ ổn định, hiệu năng và mở rộng
    - Tự động hóa quy trình (training, deployment) : Sử dụng automated ML pipelines (Kubeflow, Airflow,...)
    - Quản lý tài nguyên và API phục vụ mô hình
    - CI/CD pipelines để:
        - Tự động huấn luyện khi có dữ liệu mới
        - Triển khai mô hình tự động
        - Kiểm thử và giám sát sau triển khai

# Thực hành: Dự đoán giá nhà với Pipeline ML đầy đủ
- Gồm các bước:
    - Tạo môi trường và mở Jupyter Notebook
    - Tiền xử lý dữ liệu
    - Huấn luyện và đánh giá mô hình
    - Lưu và tải lại mô hình phục vụ production

In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import fetch_california_housing


In [2]:
# Tải dữ liệu
housing = fetch_california_housing()
X = pd.DataFrame(housing.data, columns=housing.feature_names)
y = housing.target

# Tách tập train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Chuẩn hóa dữ liệu
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [3]:
# Training
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(n_estimators=100, random_state=42)

model.fit(X_train_scaled, y_train)

In [4]:
# Model Evaluation
from sklearn.metrics import mean_squared_error, r2_score
y_pred = model.predict(X_test_scaled)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

In [5]:
print("Mean Squared Error:", mse)
print("R^2 Score:", r2)

Mean Squared Error: 0.255169737347244
R^2 Score: 0.8052747336256919


In [6]:
# Save & Load mô hình bằng Joblib
import joblib
joblib.dump(model, "california_housing_model.pkl")

['california_housing_model.pkl']

In [7]:
# Tải lại mô hình đã lưu
loaded_model = joblib.load("california_housing_model.pkl")

In [8]:
# Dự đoán với mô hình đã tải
loaded_predictions = loaded_model.predict(X_test_scaled)
print("Predictions from loaded model:", loaded_predictions[:5])

Predictions from loaded model: [0.5095    0.74161   4.9232571 2.52961   2.27369  ]


# Cloud trong MLOps
- Các nền tảng đám mây (cloud) cung cấp hạ tầng cần thiết để:
    - Huấn luyện mô hình ML với tài nguyên lớn
    - Triển khai mô hình nhanh chóng và linh hoạt
    - Quản lý vòng đời ML (lưu trữ, theo dõi, tái huấn luyện, tự động hóa)
- MLOps dựa trên cloud giúp dễ dàng scale, mornitoring, automation
-  So sánh 3 nền tảng cloud phổ biến: AWS – GCP – Azure:

| Tiêu chí              | **AWS**                                                     | **GCP**                                              | **Azure**                                        |
| --------------------- | ----------------------------------------------------------- | ---------------------------------------------------- | ------------------------------------------------ |
| **Dịch vụ ML chính**  | SageMaker, Lambda, EKS, S3                                  | AI Platform, BigQuery ML, GKE, TensorFlow Enterprise | Azure ML, AKS, Azure Functions, Blob Storage     |
| **Tính năng nổi bật** | Mạnh về automation & bảo mật, tích hợp sâu với doanh nghiệp | Tối ưu cho TensorFlow, mạnh về phân tích dữ liệu     | Tích hợp chặt với hệ sinh thái Microsoft, DevOps |
| **Chi phí**           | Trả theo mức sử dụng, có free-tier nhẹ                      | Trả theo mức sử dụng, free-tier tốt cho AI Platform  | Giá cạnh tranh, có free-tier cho ML              |

-  AWS – Amazon Web Services
    - Tạo tài khoản và cấu hình IAM Role để phân quyền truy cập
    - Sử dụng S3 để lưu dữ liệu huấn luyện
    - Dùng SageMaker để huấn luyện & triển khai mô hình
    - Triển khai mô hình quy mô lớn với Elastic Kubernetes Service (EKS)
- GCP – Google Cloud Platform
    - Tạo Google Cloud Project, bật AI Platform
    - Lưu dữ liệu trên Google Cloud Storage
    - Huấn luyện mô hình bằng AI Platform hoặc BigQuery ML
    - Orchestration với Google Kubernetes Engine (GKE)
- Azure – Microsoft Azure:
    - Tạo Azure ML Workspace để theo dõi mô hình
    - Dùng Azure Kubernetes Service (AKS) để chạy mô hình ở production
    - Tự động hóa pipeline với Azure DevOps
##  Tính năng đặc thù hỗ trợ MLOps trên mỗi cloud

| Cloud     | Hỗ trợ MLOps mạnh ở                                                                                            |
| --------- | -------------------------------------------------------------------------------------------------------------- |
| **AWS**   | SageMaker Pipelines, CI/CD tích hợp với CodePipeline, hỗ trợ training + hosting                                |
| **GCP**   | AutoML, Vertex AI (nâng cấp từ AI Platform), tích hợp BigQuery mạnh                                            |
| **Azure** | Azure ML Designer (low-code pipelines), hỗ trợ tracking và monitoring toàn diện, kết nối mạnh với Azure DevOps |

## Khi nào chọn cloud nào cho MLOps?

| Nhu cầu                                                                | Đề xuất                                             |
| ---------------------------------------------------------------------- | --------------------------------------------------- |
| Sử dụng TensorFlow, phân tích lớn với SQL                              | **GCP** (vì có BigQuery ML + TensorFlow Enterprise) |
| Triển khai ML trong hệ sinh thái Microsoft (Office 365, Teams, DevOps) | **Azure**                                           |
| Tự động hóa mạnh mẽ, cần hosting + training cùng nơi                   | **AWS** (SageMaker toàn diện từ A-Z)                |



# Docker trong MLOps
- Docker là công nghệ container hóa giúp đóng gói:
    - Mã nguồn
    - dependencies
    - Môi trường thực thi (runtime)
- Lợi ích:
    
| Lợi ích                   | Mô tả                                                               |
| ------------------------- | ------------------------------------------------------------------- |
| **Consistency**           | Mô hình chạy giống nhau ở mọi môi trường (dev → test → prod)        |
| **Reproducibility**       | Dễ tái tạo pipeline ML, kể cả sau thời gian dài                     |
| **Dependency Management** | Quản lý mọi thư viện Python & hệ thống trong một container duy nhất |
| **Portability**           | Chạy được trên local, cloud (AWS, GCP, Azure), edge,...             |
| **Scalability**           | Dễ tích hợp vào hệ thống phân tán, mở rộng với Kubernetes           |

## Docker trong tổng thể MLOps workflow

| Giai đoạn     | Docker hỗ trợ                     |
| ------------- | --------------------------------- |
| Preprocessing | Đóng gói script xử lý dữ liệu     |
| Training      | Tạo môi trường huấn luyện lặp lại |
| Deployment    | Triển khai mô hình ổn định        |
| CI/CD         | Tích hợp pipeline tự động hóa     |
| Scaling       | Kết hợp với Kubernetes để mở rộng |


# minikube và kubectl
- kubectl 
    - Là command-line tool chính thức của Kubernetes
    - Dùng để tương tác với Kubernetes cluster (local hoặc cloud)
    - Cho phép bạn:
        - Triển khai các file YAML
        - Quản lý pods, deployments, services, logs,...
        - Theo dõi trạng thái và scale ứng dụng
- minikube :
    - Là một Kubernetes cluster chạy trên máy local:
        - Chạy trong một máy ảo nhỏ (VM) hoặc Docker
        - Dùng để test, dev, học tập Kubernetes trước khi lên cloud
        - Không tốn phí cloud hay cấu hình phức tạp
    - Chức năng chính:
        - Tạo cluster Kubernetes ảo trên local
        - Cài đặt đầy đủ control plane + node
        - Cho phép bạn triển khai ứng dụng container như đang chạy trên cloud
- Nên cài ở đâu

| Công cụ            | Cài ở đâu                                                                 |
| ------------------ | ------------------------------------------------------------------------- |
| `minikube`         | **Trên host máy tính** (Mac, Linux, Windows)                              |
| `kubectl`          | Trên host **hoặc** trong container (dùng CLI) — nếu kết nối tới cụm từ xa |
| Kubernetes cluster | Dùng `minikube`, `kind`, hoặc cloud                                       |

- Cài đặt kubectl :

    ```bash
    # Cập nhật và cài đặt các gói phụ trợ
    sudo apt-get update
    sudo apt-get install -y apt-transport-https ca-certificates curl
    
    # Tải khóa GPG của Kubernetes
    sudo curl -fsSLo /usr/share/keyrings/kubernetes-archive-keyring.gpg \
      https://packages.cloud.google.com/apt/doc/apt-key.gpg
    
    # Thêm repository Kubernetes vào danh sách apt
    echo "deb [signed-by=/usr/share/keyrings/kubernetes-archive-keyring.gpg] \
      https://apt.kubernetes.io/ kubernetes-xenial main" | \
      sudo tee /etc/apt/sources.list.d/kubernetes.list > /dev/null
    
    # Cập nhật và cài đặt kubectl
    sudo apt-get update
    sudo apt-get install -y kubectl
    
    ```
- Cài đặt minikube:
 1. 
    ```bash
    # Tải bản mới nhất của Minikube
    curl -LO https://storage.googleapis.com/minikube/releases/latest/   minikube-linux-amd64

    # Đổi tên và cấp quyền thực thi
    sudo install minikube-linux-amd64 /usr/local/bin/minikube
    ```
 2. Cài driver
    ```bash
    # Cài Docker nếu chưa có
    sudo apt-get install -y docker.io
    
    # Thêm user hiện tại vào nhóm docker
    sudo usermod -aG docker $USER
    
    # Khởi động lại terminal hoặc đăng xuất / đăng nhập lại
    ```
-


https://chatgpt.com/g/g-p-68515a591614819199533a5f973fa3f2-mlops/c/68515ad6-f4e4-8000-8f8e-49236ee0a003

https://www.notion.so/C-c-l-nh-linux-c-b-n-21272b24fd9b806fa658c0c696f2f6f8


https://vcsdaotao.udemy.com/course/mastering-mlops-from-model-development-to-deployment/learn/lecture/47928429#overview

