medical-show-cleaning

Task 1: Data Cleaning and Preprocessing

Dataset: Medical Appointment No Shows (Kaggle)

Objective

Clean and prepare the raw dataset by handling missing values, duplicates, inconsistent text, and incorrect formats.

Steps Performed

Removed missing values and duplicates
Standardized column names (lowercase + underscores)
Cleaned text formats for gender and no-show columns
Converted dates to datetime format
Fixed data types (age as int, IDs as string)
Removed invalid ages (<0 or >115)

Tools Used

Python 3.11
Pandas

Output

A cleaned dataset ready for analysis: cleaned_medical_appointments.csv

Author

Rushikesh Palekar

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
Cleaned_Medical_Appointment.csv		Cleaned_Medical_Appointment.csv
Medical_Appointment.csv		Medical_Appointment.csv
README.md		README.md
Task_Data_Cleaning_Medical.ipynb		Task_Data_Cleaning_Medical.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

medical-show-cleaning

Task 1: Data Cleaning and Preprocessing

Dataset: Medical Appointment No Shows (Kaggle)

Objective

Steps Performed

Tools Used

Output

Author

About

Uh oh!

Releases

Packages

Languages

rushofcode/Data-Cleaning-Task1

Folders and files

Latest commit

History

Repository files navigation

medical-show-cleaning

Task 1: Data Cleaning and Preprocessing

Dataset: Medical Appointment No Shows (Kaggle)

Objective

Steps Performed

Tools Used

Output

Author

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages