Skip to content

PhamThe-KHDL/DS200.M21-Big-Data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 

Repository files navigation

DS200.M21 - Big Data

DS200.M21-Phân Tích Dữ Liệu Lớn

Học kỳ 2 Năm 3 Năm học 2021-2022

Final Project - Hệ Thống Dự Đoán Độ Trễ Chuyến Bay Theo Thời Gian Thực

Giảng Viên:

  • TS Đỗ Trọng Hợp

Nhóm SVTH:

  • Phạm Đức Thể
  • Võ Minh Trí
  • Trần Triệu Vũ

Bộ dữ liệu

Nội dung đồ án

  • Thu thâp, xây dựng và phân tích bộ dữ liệu
  • Hướng tiếp cận: Để tạo ra mô hình dự đoán độ trễ chuyến bay, chúng tôi tiến hành xây dựng các mô hình Máy Học (Machine Learning) như: Logistic Regression, Decision Tree Classifier, Random Forest Classifier, Naive Bayes được hỗ trợ bởi Machine Learning Library (MLlib) là một thư viện máy học của Spark. Để đánh giá mô hình chúng tôi sử dụng 4 độ đo là: Precision, Recall, Accuracy và F1–score.

ANOVA

  • Kết quả: Kết quả cao nhất mà chúng tôi đạt được là F1-macro = 45.27% sử dụng DecisionTree.

Kiến trúc hệ thống

ANOVA

Thực hiện

Phạm Đức Thể

Thể ~/~