Análisis exploratorio de datos de Netflix usando Python y SQL. Este proyecto combina limpieza de datos, consultas SQL y visualización para obtener insights sobre el contenido disponible en Netflix.
Este proyecto realiza un análisis completo del dataset de Netflix, incluyendo:
- Limpieza y preprocesamiento de datos con pandas: manejo de valores nulos, duplicados y registros cruzados.
- Creación de base de datos SQLite a partir del dataset limpio.
- Consultas SQL para agrupar, filtrar y resumir información relevante.
- Visualización con seaborn y matplotlib:
- Tendencia de títulos por año y tipo.
- Top 10 países con más títulos publicados.
- Distribución de títulos por rating para películas y series.
- Distribución de películas por duración y país.
Demostrar cómo combinar Python y SQL para analizar un dataset real y generar insights accionables sobre tendencias de contenido y preferencias de los usuarios.
El dataset utilizado es Netflix Movies and TV Shows (Kaggle).
- Python: pandas, matplotlib, seaborn, numpy
- SQL: SQLite