Skip to content

Tynab/Machine-Learning-Overview

Repository files navigation

BÀI TẬP

  1. Thực hiện Ordinal Encoding dựa trên thư viện của sklearn trên cột dữ liệu ordinal và huấn luyện lại mô hình Linear Regression.
  2. Thực hiện One-Hot Encoding cho cả bộ dữ liệu giá và huấn luyện lại mô hình Lasso, Ridge với tham số phù hợp.
  3. Kiểm tra thử xem các trường dữ liệu khác còn nhiễu không, tiến hành lọc nhiễu và huấn luyện lại mô hình ElasticNet.
  4. Giải thích sự khác nhau và ý nghĩa trong công thức của Lasso, Ridge và ElasticNet.
  5. Áp dụng thử KNeighborsRegressor của sklearn cho dữ liệu giá nhà và so sánh performance với các mô hình Linear Regression, Lasso, Ridge, ElasticNet.
  6. Tiến hành phân tích mô tả cho dữ liệu bank_data.
  7. Tìm hiểu ý nghĩa và thay đổi một số metrics như weights, algorithm, leafsize,… và hệ số n_neighbors phù hợp của mô hình kNN, so sánh performance.