GitHub - yongbin999/kaggle_whats-cooking: Kaggle data challenge with NLP models - NB, percepetron with features, scikit-learn lib

kaggle_whats-cooking

The goal of this project is to classify cuisines based on a list of ingredients from Kaggle Data Challenge dataset. My approach was to establish a baseline model using Naïve Bayes, then test performance against logistic models, and use model libraries such as Scikit-learn. The baseline NB model performed at 73% accuracy, Logistic Percepetron at 78%, and out-of-box Scikit-learn models around 77%. The top rank model in Kaggle stands at 83%.

###nb results: 55-73% python nb.py inputs/train.json or python nb.py inputs/train.json inputs/test.json

###precepetron: 73-77% +78.2 with features
python logistic_perc.py inputs/train.json
or
python logistic_perc.py inputs/train.json inputs/test.json

###Scikit-learn models: 70-77% python scikit_models.py inputs/train.json

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
inputs		inputs
outputs		outputs
.gitignore		.gitignore
README.md		README.md
dipayansinharoy_solution.py		dipayansinharoy_solution.py
logistic_perc.py		logistic_perc.py
nb.py		nb.py
scikit_convert.py		scikit_convert.py
scikit_models.py		scikit_models.py
trained_GDS_model.pkl		trained_GDS_model.pkl
trained_GDS_model.pkl_01.npy		trained_GDS_model.pkl_01.npy
trained_GDS_model.pkl_02.npy		trained_GDS_model.pkl_02.npy
trained_GDS_model.pkl_03.npy		trained_GDS_model.pkl_03.npy
trained_GDS_model.pkl_04.npy		trained_GDS_model.pkl_04.npy

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

kaggle_whats-cooking

Gradient descend 0.772662164927

one vs rest multiclass 0.768876611418

output-code errorcorreting multiclass 0.76744423982

About

Releases

Packages

Languages

yongbin999/kaggle_whats-cooking

Folders and files

Latest commit

History

Repository files navigation

kaggle_whats-cooking

Gradient descend 0.772662164927

one vs rest multiclass 0.768876611418

output-code errorcorreting multiclass 0.76744423982

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages