Crunchbase

Task:

Predict the status (acquired, open or closed) of a company using Crunchbase data from Kaggle. Given the strong class imbalance, our model is unlikely to surpass the baseline. We want to tune towards recall in classes 0 and 2 (in the above order). We don't mind missing out on some companies, but when we classify, we want to be classify these classes correctly.

Key methods/challenges:

Classification with imbalanced classes - under sampling, SMOTE, pipelines
Creative-ish feature engineering

Results:

~60% recall in classes 0 and 2.
Will need more work to optimise!

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
data		data
.gitignore		.gitignore
README.md		README.md
notebook.ipynb		notebook.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crunchbase

Task:

Key methods/challenges:

Results:

About

Releases

Packages

Languages

xaaronx/crunchbase-challenge

Folders and files

Latest commit

History

Repository files navigation

Crunchbase

Task:

Key methods/challenges:

Results:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages