Skip to content

Latest commit

 

History

History
92 lines (69 loc) · 5.46 KB

README.md

File metadata and controls

92 lines (69 loc) · 5.46 KB

Ví dụ về bài toán Regression trong thực tế


Team member:

No. Full name Student ID Class
1 Hồ Hải Thủy 19522323 CS114.L22.KHCL
2 Nguyễn Khả Tiến 19522337 CS114.L22.KHCL
3 Nguyễn Mạnh Toàn 19522363 CS114.L22.KHCL


  1. Bài toán: Dự đoán chỉ số ô nhiễm không khí ở Việt Nam
    • Input:
      • Số liệu phương tiện giao thông đang lưu hành trong cả nước của oto và xe máy: dạng số nguyên, đơn vị (triệu)
      • Dân số Việt Nam: Dạng số nguyên, đơn vị(triệu)
    • Cách thu thập:
    • Xử lý data:
      • Gộp toàn bộ dữ liệu trên thành một ma trận dưới dạng file csv, gồm có feature là số liệu phương tiện giao thông, dân số Việt Nam. Label sẽ là chỉ số ô nhiễm không khí ở Việt Nam
    • Output:
      • Một số nguyên dương là chỉ số ô nhiễm không khí ở Việt Nam mà mô hình dự đoán

  1. Bài toán: Dự đoán giá mua xe máy (đã qua sử dụng) ở Việt Nam, giúp người tiêu dùng mua xe không bị "hớ"
    • Input:

      • Mẫu xe: dạng chuỗi kí tự.
      • Năm sản xuất: dạng số nguyên, đơn vị (năm)
      • Màu: dạng chuỗi kí tự.
      • Thời gian đã sử dụng: dạng số nguyên, đơn vị (ngày)
      • Khu vực ra biển số: số nguyên (số hiệu tỉnh thành của các tỉnh ở Việt Nam)
      • Có hay Không có giấy tờ: 1 or 0
      • Chỉ số odometer: dạng số nguyên
      • Xe đã qua đại tu hay còn nguyên "zin": 1 or 0
    • Cách thu thập:

    • Xử lý data:

      • Gộp toàn bộ dữ liệu trên thành một ma trận dưới dạng file csv, mỗi hàng của ma trận là gồm có các cột tương ứng với chỉ số input (Gía mua mới, mẫu xe, odo,...). Cột cuối cùng sẽ là giá bán của chiếc xe máy đó.
    • Output:

      • Một số nguyên dương là giá bán của 1 chiếc xe máy nào đó được đưa vào, đơn vị (Triệu VNĐ).

  1. Bài toán: Dự đoán mức độ hài lòng của nhân viên đối với công việc theo mức lương, nơi làm việc
    • Input:
      • Tên công việc: dạng chuỗi string
      • Địa điểm làm việc(tỉnh): dạng chuỗi string
      • Số tiền lương: float, đơn vị(triệu)
    • Cách thu nhập:
      • Tạo google form, khảo sát nặc danh bao gồm tên công việc, địa điểm làm việc(tỉnh), mức lương, mức độ hài long từ 0 đến 10 trên các group việc làm
      • Phỏng vấn nhân viên ở các công ty.
      • Tham khảo mức lương của công việc trên trang https://jobsgo.vn/tra-cuu-luong.html .Quy đinh: tiền lương input bằng với lương trung bình của trang thì độ hài lòng bằng 6, tiền lương input lớn hơn khoảng lương phổ biến của trang thì độ hài lòng bằng 10. +Độ hài lòng sẽ bằng tiền lương input chia cho lương trung bình của trang nhân với 6(Làm trong 1 đơn vị thập phân, nếu lớn hơn 10 thì quy về 10)
    • Xử lý data:
      • Gộp toàn bộ dữ liệu trên thành một ma trận dưới dạng file csv, mỗi hàng của ma trận gồm có 4 cột tương ứng là tên công việc: string, địa điểm làm việc(tỉnh): string, số tiền lương(đơn vị triệu): float, cột cuối cùng sẽ là mức độ hài lòng của nhân viên đối với công việc( từ 0 đến 10): float.
    • Output:
      • Một số thực(float) từ 0 đến 10: là mức độ hài lòng của nhân viên đối với công việc.