Car Diagnostics Audio Classification

Multi-class classification of car engine and mechanical sounds using 5 different ML approaches, hierarchical Mixture-of-Experts architectures, and ensemble voting.

📋 Overview

This project implements a comprehensive audio classification system for vehicle diagnostics. Using the Car Diagnostics Dataset from Kaggle, we classify audio recordings into 9 distinct mechanical fault categories across three vehicle states (braking, idle, startup). The system compares traditional machine learning, deep learning, transfer learning, hierarchical architectures, and ensemble methods.

Key Results:

✅ Best single model: XGBoost with MFCC features — 88.5% accuracy
✅ Best ensemble: Majority vote of top-3 models — 91.5% accuracy
✅ Hierarchical MoE: Interpretable state → fault architecture — 83–86% accuracy

🎯 Problem Statement

Given an audio recording of a vehicle's mechanical sound, classify it into one of nine fault categories:

State	Classes
Braking (2)	`normal_brakes`, `worn_out_brakes`
Idle (4)	`normal_engine_idle`, `low_oil`, `power_steering`, `serpentine_belt`
Startup (3)	`normal_engine_startup`, `dead_battery`, `bad_ignition`

🗂️ Dataset

Source: Car Diagnostics Dataset (Kaggle)

Original samples: 949 audio files (WAV format)
After augmentation: 1,967 samples (balanced)
Audio characteristics: Variable duration (2-10 sec), real-world recordings
Train/Val/Test split: 70% / 15% / 15% (stratified)

🧠 Models Implemented

#	Model	Features	Accuracy
1	XGBoost (Baseline)	MFCCs + deltas + chroma + ZCR + RMS	88.5%
2	CNN	Mel spectrograms (128×65)	8.1%
3	CNN-LSTM	Mel spectrograms + temporal modeling	14.5%
4	YAMNet Transfer Learning	YAMNet embeddings (1024-dim)	79.1%
5	PANNs CNN14 Transfer Learning	PANNs embeddings (2048-dim)	86.2%
6	Mixture-of-Experts (PANNs)	Hierarchical state → fault	83.8%
7	Mixture-of-Experts (XGB)	Hierarchical with XGBoost	86.5%
8	Ensemble Vote (Top-3)	Majority vote of Models 1,6,7	91.5%

🏗️ Architecture Highlights

Mixture-of-Experts (Hierarchical)

Input Audio → Gating Model (3 states) → Expert Model (fault) ↓ braking_state → [normal_brakes, worn_out_brakes] idle_state → [low_oil, normal_idle, power_steering, serpentine_belt] startup_state → [bad_ignition, dead_battery, normal_startup]

Ensemble Voting

Voters: XGBoost (MFCCs) + MoE PANNs + MoE XGBoost
Rule: Unanimous → that class; 2-of-3 → majority; Tie → summed probabilities
Result: 91.5% accuracy (3% improvement over best single model)

📊 Results

Performance Comparison

Model Accuracy Weighted F1 ─────────────────────────────────────────────────────── XGBoost (MFCCs) 0.8851 0.8827 PANNs CNN14 0.8615 0.8614 Mixture-of-Experts (XGB) 0.8649 0.8648 Ensemble Vote (Top-3) 0.9155 0.9142 Mixture-of-Experts (PANNs) 0.8378 0.8388 YAMNet Transfer Learning 0.7905 0.7904 CNN-LSTM Hybrid 0.1453 0.0803 CNN (Mel Spectrogram) 0.0811 0.0391

Per-Class Performance (Ensemble)

Class	Precision	Recall	F1-Score
bad_ignition	0.96	0.86	0.91
dead_battery	0.96	1.00	0.98
low_oil	0.82	0.72	0.77
normal_brakes	0.85	1.00	0.92
normal_engine_idle	0.93	1.00	0.96
normal_engine_startup	0.87	0.96	0.91
power_steering	0.92	0.87	0.89
serpentine_belt	1.00	0.94	0.97
worn_out_brakes	0.94	0.88	0.91

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
more_samples		more_samples
samples		samples
.gitignore		.gitignore
README.md		README.md
car_diagnostics.py		car_diagnostics.py
car_diagnostics_v7.ipynb		car_diagnostics_v7.ipynb
chunk_audio.py		chunk_audio.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Car Diagnostics Audio Classification

📋 Overview

🎯 Problem Statement

🗂️ Dataset

🧠 Models Implemented

🏗️ Architecture Highlights

Mixture-of-Experts (Hierarchical)

Ensemble Voting

📊 Results

Performance Comparison

Per-Class Performance (Ensemble)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Car Diagnostics Audio Classification

📋 Overview

🎯 Problem Statement

🗂️ Dataset

🧠 Models Implemented

🏗️ Architecture Highlights

Mixture-of-Experts (Hierarchical)

Ensemble Voting

📊 Results

Performance Comparison

Per-Class Performance (Ensemble)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages