Binary-Classification-XGB

Assessment solution for Arya-ai Binary classification problem

Project File Struture:

Root /fldr

Alpha&Omega.ipynb <---- Main Jupyter notebook (Forgot to change name)
Assignement - Data Scientist (1).docx <---- Assessment problem document
Testing_predicitons.csv <---- Target class outputs of the Test Data
README.md <---- this very file
XGBFTW.sav <---- XGBoost model export done over using pickle
requirements.txt <---- Environment Screenshot
essentials_only_req.txt <---- ipynb specific requirements
Data /fldr
- Training_set.csv <---- Training Dataset
- Test_set.csv <---- Testing Dataset

Data Stats:

Train Dataset Shape -> (3910,58)
Test Dataset Shape -> (691,57)
Dataset is Sparse and High Dimensional
Features are highly skewed

Key Decisions:

Used RandomForest Classifier for feature selection.
Selected top 30 features with respect to their feature importance.
For metric considered Binary CrossEntropy | LogLoss and ROC-AUC score.
Model of choice is Xgboost.

Process Flow - Main.ipynb (Alpha&Omega.ipynb)

EDA
Splitting the data
Feature Selection
Data Scaling - Normalization
Model Training
Prediction Metrics
Processing and Predicting on Test Data
Saving Model for Future Usage
Exporting Y_test Predicted scores
Generating requirements. #Has an important Note. Must Read!

Process Flow - Performance_print.py

Splitting the Data
Feature Selection
Importing Presaved model
Using presaved model to generate scores
Using Prettytable to print output table

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
Data		Data
Alpha&Omega.ipynb		Alpha&Omega.ipynb
Assignment - Data Scientist (1).docx		Assignment - Data Scientist (1).docx
LICENSE		LICENSE
Performance_print_script.py		Performance_print_script.py
README.md		README.md
Testing_predictions.csv		Testing_predictions.csv
XGBFTW.sav		XGBFTW.sav
essential_only_req.txt		essential_only_req.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Binary-Classification-XGB

Assessment solution for Arya-ai Binary classification problem

Project File Struture:

Data Stats:

Key Decisions:

Process Flow - Main.ipynb (Alpha&Omega.ipynb)

Process Flow - Performance_print.py

Had fun making this!!

About

Releases

Packages

Languages

License

man-o-war/Binary-Classification-XGB

Folders and files

Latest commit

History

Repository files navigation

Binary-Classification-XGB

Assessment solution for Arya-ai Binary classification problem

Project File Struture:

Data Stats:

Key Decisions:

Process Flow - Main.ipynb (Alpha&Omega.ipynb)

Process Flow - Performance_print.py

Had fun making this!!

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages