Machine Learning Algorithms Repository

Repository toàn diện để học tập và triển khai các thuật toán Machine Learning với các kiểu học khác nhau.

📁 Cấu Trúc Thư Mục

Machine Learning Algorithm/
│
├── supervised/                          # Học có giám sát
│   ├── classification/                  # Phân loại (Classification)
│   │   ├── logistic_regression.py
│   │   ├── decision_tree.py
│   │   ├── random_forest.py
│   │   ├── svm.py
│   │   ├── knn.py
│   │   └── naive_bayes.py
│   └── regression/                      # Hồi quy (Regression)
│       ├── linear_regression.py
│       ├── polynomial_regression.py
│       ├── ridge_lasso.py
│       └── svr.py
│
├── unsupervised/                        # Học không giám sát
│   ├── clustering/                      # Phân cụm (Clustering)
│   │   ├── kmeans.py
│   │   ├── hierarchical_clustering.py
│   │   ├── dbscan.py
│   │   └── gaussian_mixture.py
│   └── dimensionality_reduction/        # Giảm chiều
│       ├── pca.py
│       ├── tsne.py
│       └── autoencoder.py
│
├── reinforcement_learning/              # Học tăng cường
│   ├── q_learning.py
│   ├── policy_gradient.py
│   ├── actor_critic.py
│   └── deep_q_learning.py
│
├── deep_learning/                       # Học sâu
│   ├── neural_networks.py
│   ├── convolutional_networks.py
│   ├── recurrent_networks.py
│   └── transformers.py
│
├── utils/                               # Công cụ hữu ích
│   ├── data_preprocessing.py
│   ├── metrics.py
│   └── visualization.py
│
├── examples/                            # Các ví dụ sử dụng
│   ├── supervised_example.py
│   ├── unsupervised_example.py
│   ├── reinforcement_example.py
│   └── deep_learning_example.py
│
├── tests/                               # Các bài kiểm tra
│   ├── test_supervised.py
│   ├── test_unsupervised.py
│   └── test_utils.py
│
├── data/                                # Dữ liệu mẫu
│   └── datasets/
│
├── requirements.txt                     # Dependencies
└── README.md                            # Documentation

🎯 Các Loại Học (Learning Types)

1. Supervised Learning (Học có giám sát)

Classification: Phân loại dữ liệu vào các lớp (Linear Models, Tree-based, SVM, KNN)
Regression: Dự đoán giá trị liên tục (Linear, Polynomial, Ridge/Lasso, SVR)

2. Unsupervised Learning (Học không giám sát)

Clustering: Nhóm các điểm dữ liệu tương tự nhau (K-means, Hierarchical, DBSCAN)
Dimensionality Reduction: Giảm số lượng feature (PCA, t-SNE, Autoencoders)

3. Reinforcement Learning (Học tăng cường)

Các thuật toán học qua tương tác với môi trường (Q-Learning, Policy Gradient, DQN)

4. Deep Learning (Học sâu)

Các mạng nơ-ron sâu (Neural Networks, CNN, RNN, Transformers)

🚀 Cách Sử Dụng

Cài đặt Dependencies

pip install -r requirements.txt

Sử dụng một thuật toán

from supervised.classification.logistic_regression import LogisticRegression
from utils.data_preprocessing import load_data, preprocess_data

# Load và chuẩn bị dữ liệu
X, y = load_data('data/your_dataset.csv')
X_train, X_test, y_train, y_test = preprocess_data(X, y)

# Huấn luyện mô hình
model = LogisticRegression()
model.fit(X_train, y_train)

# Dự đoán
predictions = model.predict(X_test)

Chạy các ví dụ

python examples/supervised_example.py
python examples/unsupervised_example.py

📊 Các Công Cụ Hữu Ích (Utils)

data_preprocessing.py: Chuẩn bị dữ liệu (normalization, scaling, split)
metrics.py: Tính toán metrics (accuracy, F1, MSE, etc.)
visualization.py: Hình ảnh hóa kết quả (plots, confusion matrix, etc.)

✅ Cơ Chế Đặt Tên (Naming Convention)

File Python: snake_case (e.g., linear_regression.py)
Class: PascalCase (e.g., class LinearRegression)
Function/Method: snake_case (e.g., def fit(), def predict())
Constant: UPPER_SNAKE_CASE (e.g., LEARNING_RATE = 0.01)

📝 Cấu Trúc Mỗi File Thuật Toán

Mỗi file thuật toán nên có:

Docstring: Mô tả thuật toán
Import: Các thư viện cần thiết
Class/Function: Định nghĩa thuật toán
Methods: fit(), predict(), score() (nếu có)
Example: Ví dụ sử dụng ở cuối file

"""
Module: Linear Regression
Description: Thuật toán hồi quy tuyến tính cơ bản
Author: Your Name
Date: YYYY-MM-DD
"""

import numpy as np
from typing import Tuple

class LinearRegression:
    """
    Linear Regression Model.
    
    Mô tả thuật toán, công thức toán học, và parameters.
    """
    
    def __init__(self, learning_rate: float = 0.01):
        self.learning_rate = learning_rate
        self.weights = None
        self.bias = None
    
    def fit(self, X: np.ndarray, y: np.ndarray) -> None:
        """Huấn luyện mô hình"""
        pass
    
    def predict(self, X: np.ndarray) -> np.ndarray:
        """Dự đoán"""
        pass

if __name__ == "__main__":
    # Ví dụ sử dụng
    pass

🔍 Hướng Dẫn Tìm Kiếm Thuật Toán

Xác định loại học (Supervised/Unsupervised/Reinforcement/Deep)
Tìm danh mục tương ứng (Classification/Regression/Clustering/etc.)
Chọn file của thuật toán cần dùng
Xem docstring và example để hiểu cách dùng

📚 Tài Liệu Tham Khảo

Mỗi file nên bao gồm:

Link đến các bài viết giáo dục
Công thức toán học liên quan
Reference papers (nếu có)
Ưu/nhược điểm của thuật toán

🤝 Quy Tắc Đóng Góp

Khi thêm thuật toán mới, vui lòng tuân theo các bước sau:

1️⃣ Tạo File Trong Thư Mục Phù Hợp

Xác định loại học: Chọn thư mục lớp nhất (supervised, unsupervised, reinforcement_learning, deep_learning)
Chọn danh mục: Chọn thư mục con phù hợp
- Classification: Phân loại dữ liệu
- Regression: Dự đoán giá trị liên tục
- Clustering: Phân cụm dữ liệu
- Dimensionality Reduction: Giảm chiều dữ liệu
Đặt tên file: Sử dụng snake_case theo naming convention (vd: linear_regression.py, random_forest.py)
Ví dụ: File classification model → supervised/classification/your_algorithm.py

2️⃣ Viết Docstring Chi Tiết

Mỗi file nên bao gồm:

Module docstring (đầu file):
- Tên module
- Mô tả tổng quát thuật toán
- Tên tác giả (Author)
- Ngày tạo (Date)
Class/Function docstring:
- Mô tả chi tiết thuật toán
- Công thức toán học (nếu có)
- Parameters: kiểu dữ liệu, mô tả
- Returns: kiểu dữ liệu, mô tả
- Ưu điểm và nhược điểm
Method docstring:
- Mô tả ngắn gọn công dụng
- Parameters
- Returns

Ví dụ:

"""
Module: Linear Regression
Description: Thuật toán hồi quy tuyến tính - dự đoán giá trị liên tục
Author: Your Name
Date: 2026-03-30
"""

class LinearRegression:
    """
    Linear Regression Model - Mô hình hồi quy tuyến tính
    
    Sử dụng phương pháp Ordinary Least Squares (OLS) để tìm ra
    đường thẳng phù hợp nhất cho dữ liệu.
    
    Công thức: y = w*x + b
    
    Ưu điểm:
    - Đơn giản, dễ hiểu
    - Tính toán nhanh
    - Kết quả dễ diễn giải
    
    Nhược điểm:
    - Chỉ phù hợp với mối quan hệ tuyến tính
    - Nhạy cảm với outliers
    """

3️⃣ Thêm Examples

Ví dụ trong file chính: Thêm phần if __name__ == "__main__": ở cuối file
- Tạo dữ liệu mẫu hoặc load dữ liệu
- Khởi tạo model
- Huấn luyện (fit())
- Dự đoán (predict())
- Đánh giá (score())
Ví dụ trong thư mục examples/: Nếu thuật toán phức tạp
- Tạo file ví dụ riêng (vd: supervised_example.py)
- Bao gồm cả data loading và visualization

Ví dụ trong file:

if __name__ == "__main__":
    # Tạo dữ liệu mẫu
    X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]])
    y = np.array([2, 3, 4, 5])
    
    # Khởi tạo và huấn luyện
    model = LinearRegression(learning_rate=0.01)
    model.fit(X, y)
    
    # Dự đoán
    predictions = model.predict(X)
    print(f"Dự đoán: {predictions}")
    
    # Đánh giá
    accuracy = model.score(X, y)
    print(f"Chính xác: {accuracy}")

4️⃣ Cập Nhật README.md

Thêm vào cấu trúc thư mục (phần 📁):
- Thêm tên file vào vị trí phù hợp trong cây thư mục
Cập nhật danh sách thuật toán (nếu có):
- Thêm tên vào danh sách trong phần mô tả loại học
Cập nhật Last Updated: Thay đổi ngày tháng ở cuối README

Ví dụ:

supervised/
  classification/
    ├── logistic_regression.py
    ├── decision_tree.py
    ├── random_forest.py
    ├── svm.py
    ├── knn.py
    └── naive_bayes.py

5️⃣ Viết Tests (Tùy Chọn Nhưng Được Khuyến Khích)

Tạo file test trong thư mục tests/ với tên test_*.py
Test các trường hợp:
- Khởi tạo model
- Fit với dữ liệu hợp lệ
- Predict với dữ liệu mới
- Edge cases (dữ liệu trống, kích thước sai, etc.)
Sử dụng pytest hoặc unittest:

import pytest
from supervised.classification.your_algorithm import YourAlgorithm

def test_init():
    model = YourAlgorithm()
    assert model is not None

def test_fit():
    X = [[1, 2], [3, 4]]
    y = [0, 1]
    model = YourAlgorithm()
    model.fit(X, y)
    assert model.weights is not None

def test_predict():
    X = [[1, 2], [3, 4]]
    y = [0, 1]
    model = YourAlgorithm()
    model.fit(X, y)
    predictions = model.predict(X)
    assert len(predictions) == 2

📋 Checklist Trước Khi Commit

File đặt tên đúng theo naming convention
Docstring đầy đủ và chi tiết
Có ví dụ sử dụng cơ bản
Cập nhật README.md
Type hints thích hợp
Code có comment rõ ràng
Tests viết (nếu khả năng)
Không có lỗi syntax (chạy python -m py_compile file.py)

Lưu ý: Kiểm tra kỹ code trước khi đóng góp để đảm bảo chất lượng!

Last Updated: 2026-03-29

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Machine Learning Algorithms Repository

📁 Cấu Trúc Thư Mục

🎯 Các Loại Học (Learning Types)

1. Supervised Learning (Học có giám sát)

2. Unsupervised Learning (Học không giám sát)

3. Reinforcement Learning (Học tăng cường)

4. Deep Learning (Học sâu)

🚀 Cách Sử Dụng

Cài đặt Dependencies

Sử dụng một thuật toán

Chạy các ví dụ

📊 Các Công Cụ Hữu Ích (Utils)

✅ Cơ Chế Đặt Tên (Naming Convention)

📝 Cấu Trúc Mỗi File Thuật Toán

🔍 Hướng Dẫn Tìm Kiếm Thuật Toán

📚 Tài Liệu Tham Khảo

🤝 Quy Tắc Đóng Góp

1️⃣ Tạo File Trong Thư Mục Phù Hợp

2️⃣ Viết Docstring Chi Tiết

3️⃣ Thêm Examples

4️⃣ Cập Nhật README.md

5️⃣ Viết Tests (Tùy Chọn Nhưng Được Khuyến Khích)

📋 Checklist Trước Khi Commit

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
deep_learning		deep_learning
examples		examples
reinforcement_learning		reinforcement_learning
supervised		supervised
tests		tests
unsupervised		unsupervised
utils		utils
.gitignore		.gitignore
QUICKSTART.md		QUICKSTART.md
README.md		README.md
SETUP_COMPLETE.txt		SETUP_COMPLETE.txt
STRUCTURE.md		STRUCTURE.md
TEMPLATE.py		TEMPLATE.py
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Machine Learning Algorithms Repository

📁 Cấu Trúc Thư Mục

🎯 Các Loại Học (Learning Types)

1. Supervised Learning (Học có giám sát)

2. Unsupervised Learning (Học không giám sát)

3. Reinforcement Learning (Học tăng cường)

4. Deep Learning (Học sâu)

🚀 Cách Sử Dụng

Cài đặt Dependencies

Sử dụng một thuật toán

Chạy các ví dụ

📊 Các Công Cụ Hữu Ích (Utils)

✅ Cơ Chế Đặt Tên (Naming Convention)

📝 Cấu Trúc Mỗi File Thuật Toán

🔍 Hướng Dẫn Tìm Kiếm Thuật Toán

📚 Tài Liệu Tham Khảo

🤝 Quy Tắc Đóng Góp

1️⃣ Tạo File Trong Thư Mục Phù Hợp

2️⃣ Viết Docstring Chi Tiết

3️⃣ Thêm Examples

4️⃣ Cập Nhật README.md

5️⃣ Viết Tests (Tùy Chọn Nhưng Được Khuyến Khích)

📋 Checklist Trước Khi Commit

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages