Skip to content

Repositori ini berisi dua project analisis data menggunakan metodologi CRISP-DM. Project pertama meneliti tren penjualan Walmart dengan Supervised analysis menggunakan algoritma Naive Bayes Gaussian dan K-Nearest Neighbors. Project kedua mengeksplorasi faktor sosio-ekonomi antar negara dengan Unsupervised analysis.

License

Notifications You must be signed in to change notification settings

hadiprasetiyo/MiningMinds-Supervised-and-Unsupervised

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Final Project: Data Mining 📊

Project 1: Supervised Analysis of Walmart Sales Trends 🛒

Overview

Proyek ini bertujuan untuk menganalisis tren penjualan Walmart menggunakan pendekatan terawasi. Metodologi yang digunakan adalah CRISP-DM, yang terdiri dari beberapa tahap berikut:

  1. Business Understanding: Memahami tujuan dan objektif bisnis terkait tren penjualan Walmart.
  2. Data Understanding: Mendapatkan pemahaman awal tentang dataset penjualan Walmart.

Data Preparation 🛠️

  • Cleaning: Membersihkan dataset untuk memastikan keakuratan dan konsistensi.
  • Transformation & Extraction: Mengubah dan mengekstraksi fitur yang relevan dari dataset.
  • Reduction: Mengurangi dimensionalitas dataset jika diperlukan.
  • Slicing: Memotong dataset untuk fokus pada aspek tertentu.
  • Formatting:
    • Encoding: Mengkodekan variabel kategorikal.
    • Splitting: Memisahkan dataset untuk tujuan pelatihan dan pengujian.
    • Cross Validation: Mengimplementasikan teknik validasi silang.

Modelling 🤖

  • Preprocessing: Memproses dataset sebelum pemodelan.
  • Modelling:
    • Gaussian Naive Bayes (GNB)
    • K-Nearest Neighbors (KNN)
    • C4.5 Decision Tree

Evaluation 📝

Menilai kinerja model yang telah dibuat.

Deployment 🚀

Mengimplementasikan model yang telah dilatih untuk penggunaan praktis.

Detailed Report 📄

Project 2: Unsupervised Analysis of Socio-Economic Factors Across Countries

Overview

Proyek ini berfokus pada analisis unsupervised menggunakan metodologi CRISP-DM untuk menganalisis faktor sosial-ekonomi antar negara.

  1. Business Understanding 🌐: Memahami faktor sosial-ekonomi yang mempengaruhi kesejahteraan negara.
  2. Data Understanding 📊: Mengumpulkan dan menggambarkan dataset sosial-ekonomi.

Data Exploration 🔍

  • Handling Outliers: Mengatasi outlier dalam dataset.

Data Preparation 🛠️

  • Missing Value Check: Memeriksa nilai kosong dalam dataset.
  • Bivariate Analysis: Menganalisis hubungan antara pasangan variabel.

Evaluation 📝

Menilai langkah-langkah pra pemrosesan.

Modelling 🤖

  • Pemodelan: Melakukan pemodelan unsupervised untuk mengidentifikasi pola dan faktor kunci yang mempengaruhi kesejahteraan negara.

Evaluation 📝

Menilai kinerja model.

Deployment 🚀

Mengimplementasikan wawasan yang diperoleh dari analisis.

Detailed Report 📄

About

Repositori ini berisi dua project analisis data menggunakan metodologi CRISP-DM. Project pertama meneliti tren penjualan Walmart dengan Supervised analysis menggunakan algoritma Naive Bayes Gaussian dan K-Nearest Neighbors. Project kedua mengeksplorasi faktor sosio-ekonomi antar negara dengan Unsupervised analysis.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published