Đồ án môn học Kỹ thuật lập trình Python - IE221
File note_traffic_sign_comparison.ipynb tổng hợp các mô hình.
- Mô hình đã có từ môn Học máy thống kê - DS102 (KNN, SVM, CNN) với độ chính xác cao hơn.
- Mô hình Random Forest, XGBoot vừa được đào tạo thêm trong dự án này.
File traffic_sign_clf.py mô hình CNN được tùy chỉnh phục vụ mục tiêu đề ra trong đồ án môn học này. Lý do chọn CNN là vì dựa trên kết quả so sánh giữa các mô hình thì CNN cho độ chính xác cao nhất, là mô hình phân loại tốt nhất.
- Mục tiêu của dự án này là đào tạo một mô hình phát hiện và phân loại biển báo giao thông của Đức
- Đào tạo các mô hình phân loại: KNN, SVM, RF, CNN
- Bài toán phân loại 1 ảnh nhiều lớp
- Input: Một ảnh hoặc video chứa biển báo giao thông.
- Output: Nhận dạng và phân loại biển báo giao thông đó.
Tập dữ liệu được sử dụng để đào tạo mô hình phân loại biển báo giao thông là Germen Traffic Sign Recognition Benchmark (GTSRB)
- Tập dữ liệu công khai tại Kaggle, được cập nhật bởi cộng đồng những người làm việc trong lĩnh vực ML, AI mỗi ngày và là một trong những thư viện tập dữ liệu trực tuyến lớn nhất.
- Ngoài ra, GTSRB là một thử thách phân loại nhiều lớp, được tổ chức tại International Joint Conference on Neural Networks (IJCNN) 2011.
- Tập dữ liệu gồm có hơn 50.000 hình ảnh, gồm 43 lớp
- Load dữ liệu
- Khám phá, phân tích tập dữ liệu
- Trực quan hóa dữ liệu
- Tiền xử lí (Resizing, Grayscaling, Histogram equalization,...)
- Create model
- Train model
- Fit
- Prediction
- Đánh giá mô hình
Đầu vào là 1 ảnh
Đầu vào là video