Deterministic Sampling Ensemble

Deterministic Sampling Ensemble diagram

Deterministic Sampling diagram

Experiment 1 - Evaluating the best sampling method

Experiment files:

Methods:

DSE - Deterministic Sampling Ensemble

Base classifiers:

Data streams:

Generators:
- stream-learn
- MOA
Concept drift:
- sudden
- incremental
Objects: 15 000
Features: 10
Imbalance Ratio: 10%
Noise: 10%
Random samples: 333

Results:

Results of Random Under Sampling combination with oversampling methods. Darker is better, best value isbold and underscored

Results of SVMSMOTE combination with undersampling methods. Darker is better, best value is bold andunderscored

Results of NCR combination with oversampling methods. Darker is better, best value is bold and underscored

Experiment 2 - Evaluating the best balance ratio param

Files:

Methods:

DSE - Deterministic Sampling Ensemble

Base classifiers:

Data streams:

Generators:
- stream-learn
- MOA
Concept drift:
- sudden
- incremental
Objects: 15 000
Features: 10
Imbalance Ratio: 10%
Noise: 10%
Random samples: 333

Results:

Balance parameter setup experiment. Darker is better, best value bold and underscore

Experiment 3 - Evaluating the performance on different noise ratio data stream

Files:

Methods:

DSE - Deterministic Sampling Ensemble
REA - Recursive ensemble approach
KMC - K-mean clustering undersampling ensemble
L++CDS - Learn++CDS
L++NIE - Learn++NIE
OUSE - Over and under-sampling ensemble
MLPC - Multi-layer perceptron classifier

Base classifiers:

Data streams:

Generator: stream-learn
Concept drift: incremental
Objects: 10 000
Features: 10
Imbalance Ratio: 10%
Noise: 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%
Random samples: 111, 222, 333, 444, 555

Results:

Selected mean results from noise experiments

Experiment 4 - Evaluating the performance on different balance ratio data stream

Files:

Base classifiers:

Methods:

DSE - Deterministic Sampling Ensemble
REA - Recursive ensemble approach
KMC - K-mean clustering undersampling ensemble
L++CDS - Learn++CDS
L++NIE - Learn++NIE
OUSE - Over and under-sampling ensemble
MLPC - Multi-layer perceptron classifier

Data streams:

Generator: stream-learn
Concept drift: incremental
Objects: 10 000
Features: 10
Imbalance Ratio: 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%
Noise: 10%
Random samples: 111, 222, 333, 444, 555

Results:

Selected mean results from noise and balance experiments

Experiment 5 - Main evaluation (synthetic data)

Files:

Base classifiers:

Methods:

DSE - Deterministic Sampling Ensemble
REA - Recursive ensemble approach
KMC - K-mean clustering undersampling ensemble
L++CDS - Learn++CDS
L++NIE - Learn++NIE
OUSE - Over and under-sampling ensemble
MLPC - Multi-layer perceptron classifier

Data streams:

Generators:
- stream-learn
- MOA
Concept drifts:
- 1 sudden
- 1 incremental
- 5 sudden
- 5 incremental
Objects: 100 000
Features: 10
Imbalance Ratio: 10%, 20%, 30%
Noise: 0%, 10%
Random samples: 111, 222

Results:

Wilcoxon pair rank-sum tests for synthetic data streams with incremental concept drift. Dashed vertical line isa critical value with a confidence level 0.05 (green – win, yellow – tie, red – loss)

Wilcoxon pair rank-sum tests for synthetic data streams with sudden concept drift. Dashed vertical line is acritical value with a confidence level 0.05 (green – win, yellow – tie, red – loss)

Experiment 5 - Main evaluation (real data)

Files:

Base classifiers:

Methods:

DSE - Deterministic Sampling Ensemble
REA - Recursive ensemble approach
KMC - K-mean clustering undersampling ensemble
L++CDS - Learn++CDS
L++NIE - Learn++NIE
OUSE - Over and under-sampling ensemble

Data streams:

Results:

F-score metric over the data chunks for covtypeNorm-1-2vsAll data stream with SVM base classifier

F-score metric over the data chunks for poker-lsn-1-2vsAll data stream with SVM base classifier

Name	Name	Last commit message	Last commit date
Latest commit JakubKlik Backup May 19, 2022 ac0e824 · May 19, 2022 History 11 Commits
core	core	Backup	May 19, 2022
diagrams	diagrams	Final version	Oct 22, 2020
ensembles	ensembles	Final version	May 20, 2020
results	results	Backup	May 19, 2022
streams	streams	Labels fix	Oct 5, 2020
.gitignore	.gitignore	Gitignore	May 19, 2022
README.md	README.md	Final version	Oct 22, 2020
analyze_results_best_params.py	analyze_results_best_params.py	Final version	Oct 22, 2020
analyze_results_exp_balance.py	analyze_results_exp_balance.py	Backup	May 19, 2022
analyze_results_exp_noise.py	analyze_results_exp_noise.py	Backup	May 19, 2022
analyze_results_main.py	analyze_results_main.py	Final version	Oct 22, 2020
experiment_best_balance_ratio.py	experiment_best_balance_ratio.py	Final version	May 20, 2020
experiment_best_sampling.py	experiment_best_sampling.py	Final version	May 20, 2020
experiment_exp_balance.py	experiment_exp_balance.py	Final version	May 20, 2020
experiment_exp_noise.py	experiment_exp_noise.py	Final version	May 20, 2020
experiment_main_moa_1d.py	experiment_main_moa_1d.py	Final version	May 20, 2020
experiment_main_moa_5d.py	experiment_main_moa_5d.py	Final version	May 20, 2020
experiment_main_real_data.py	experiment_main_real_data.py	Path fix	Oct 2, 2020
experiment_main_sl_1d.py	experiment_main_sl_1d.py	Final version	May 20, 2020
experiment_main_sl_5d.py	experiment_main_sl_5d.py	Final version	May 20, 2020
f1_score.eps	f1_score.eps	Backup	May 19, 2022

w4k2/DSE

Folders and files

Latest commit

History

Repository files navigation

Deterministic Sampling Ensemble

Experiment 1 - Evaluating the best sampling method

Experiment files:

Methods:

Base classifiers:

Data streams:

Results:

Experiment 2 - Evaluating the best balance ratio param

Files:

Methods:

Base classifiers:

Data streams:

Results:

Experiment 3 - Evaluating the performance on different noise ratio data stream

Files:

Methods:

Base classifiers:

Data streams:

Results:

Experiment 4 - Evaluating the performance on different balance ratio data stream

Files:

Base classifiers:

Methods:

Data streams:

Results:

Experiment 5 - Main evaluation (synthetic data)

Files:

Base classifiers:

Methods:

Data streams:

Results:

Experiment 5 - Main evaluation (real data)

Files:

Base classifiers:

Methods:

Data streams:

Results:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages