Skip to content

JRG1988/data_wrangling_python_pandas

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

data_wrangling_python_pandas

Limpieza y preparación de datos con Python (pandas)

📄 Descripción

Este proyecto forma parte de mi formación en análisis de datos y está enfocado en la limpieza y manipulación de datos con la librería pandas. El objetivo fue preparar un conjunto de datos para su posterior análisis, aplicando buenas prácticas de data wrangling.

Durante el desarrollo se realizaron las siguientes tareas:

-Importación de archivos CSV y Excel.

-Detección y tratamiento de valores ausentes.

-Eliminación de duplicados y estandarización de nombres de columnas.

-Filtrado y ordenamiento de registros con condiciones lógicas.

-Análisis exploratorio básico mediante estadísticas descriptivas.

🛠️ Herramientas y tecnologías

-Python

-Pandas

-Jupyter Notebook

-Google Colab

📊 Resultados

El dataset final quedó depurado, sin valores ausentes ni duplicados, y con una estructura lista para aplicar análisis estadísticos o visualizaciones posteriores. Este proceso mejora la calidad de los datos y garantiza conclusiones más confiables.

🚀 Cómo ejecutar el proyecto

  1. Descarga el archivo Proyecto_Data_Wrangling.ipynb.

  2. Abre el notebook en Jupyter Notebook, JupyterLab o Google Colab.

  3. Asegúrate de tener instaladas las librerías requeridas ejecutando: pip install pandas

  4. Si deseas replicar el proceso completo, utiliza los archivos disponibles en la carpeta data:

data/dataset_original.csv → Archivo de datos sin procesar.

data/dataset_limpio.xlsx → Archivo limpio y organizado.

🧠 Nota técnica

El proyecto fue desarrollado inicialmente en la plataforma del Bootcamp y posteriormente ajustado en Google Colab para eliminar comentarios de revisión. Esto puede generar ligeras diferencias en algunos resultados debido a variaciones en el entorno de ejecución o en la versión del archivo. Sin embargo, el proceso de limpieza y las conclusiones generales se mantienen consistentes y válidas.

About

Proyecto de limpieza y preparación de datos con Python (pandas).

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published