Anonymized_Data_Analysis

Research Project on a completely anonymized dataset (no idea about the data, features and features had no labels). Data files are apache parquet and size is 7 million. Highly imbalanced dataset with 99.995 and 0.005 percentage of 0's and 1's respectively.

Goal 1: To find useful features which are affecting the output variables from the list of 500+ variables. Goal 2: To build a predictive model based on the new features

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
Data_Science_Case_Study.html		Data_Science_Case_Study.html
Data_Science_Case_Study.ipynb		Data_Science_Case_Study.ipynb
README.md		README.md
Result and Analysis.pdf		Result and Analysis.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Anonymized_Data_Analysis

About

Releases

Packages

Languages

akshatshreemali/Anonymized_Data_Analysis

Folders and files

Latest commit

History

Repository files navigation

Anonymized_Data_Analysis

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages