Diabetes Data Cleaning, Normalization, and Visualization with Python

This project demonstrates a complete workflow for preparing and exploring diabetes datasets using Python. The key steps include:

Data cleaning and handling missing values
Removing duplicates and outliers
Feature scaling and normalization
Exploratory data analysis with correlation heatmaps, pairplots, and distribution plots
Preparing data for machine learning models

Tools used: Python, Pandas, NumPy, Seaborn, Matplotlib, Scikit-learn

The workflow helps uncover patterns and relationships among diabetes-related features, making the dataset ML-ready.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Diabetes_Normalized_Cleaned_Dataset.ipynb		Diabetes_Normalized_Cleaned_Dataset.ipynb
README.md		README.md
correlation_heatmap.png		correlation_heatmap.png
diabetes.csv		diabetes.csv
diabetes_cleaned_normalized.csv		diabetes_cleaned_normalized.csv
diabetes_cleaned_visualized.csv		diabetes_cleaned_visualized.csv
feature_distributions.png		feature_distributions.png
pairplot.png		pairplot.png

Provide feedback