Dealing-With-Imbalanced-Data

Using Imblearn To Tackle Imbalanced Data Sets

Imbalanced data is a frequently occuring feature of data sets found in various fields such as epidemiology, marketing and fraud detection. Here I show examples of some methods for dealing with such data. The data used came from the KEEL data set repository. I used a data set called 'yeast3' which had a class imbalance ratio of 1:8.1.

Resources used:

Imbalanced-learn documentation.

http://contrib.scikit-learn.org/imbalanced-learn/index.html

Data mining with imbalanced class distributions concepts and methods (Prati et al 2009).

http://conteudo.icmc.usp.br/pessoas/gbatista/files/iicai2009.pdf

Resampling techniques and other strategies - Ajinkya More.
https://www.youtube.com/watch?v=-Z1PaqYKC1w
KEEL data set repository.

http://sci2s.ugr.es/keel/imbalanced.php

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
1 - Results.ipynb		1 - Results.ipynb
2 - Under Sampling Example.ipynb		2 - Under Sampling Example.ipynb
3 - Over Sampling Example.ipynb		3 - Over Sampling Example.ipynb
4 - Combination Example.ipynb		4 - Combination Example.ipynb
5 - Ensemble Example.ipynb		5 - Ensemble Example.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

1 - Results.ipynb

1 - Results.ipynb

2 - Under Sampling Example.ipynb

2 - Under Sampling Example.ipynb

3 - Over Sampling Example.ipynb

3 - Over Sampling Example.ipynb

4 - Combination Example.ipynb

4 - Combination Example.ipynb

5 - Ensemble Example.ipynb

5 - Ensemble Example.ipynb

README.md

README.md

Repository files navigation

Dealing-With-Imbalanced-Data

About

Releases

Packages

Languages

mldataanalysis/Dealing-With-Imbalanced-Data

Folders and files

Latest commit

History

Repository files navigation

Dealing-With-Imbalanced-Data

About

Resources

Stars

Watchers

Forks

Languages