# Análisis Exploratorio de Datos: Tendencias de Salud y Fitness (2019-2024)

Este proyecto realiza un análisis exploratorio de datos (EDA) para entender las tendencias de popularidad de diversas disciplinas de fitness como Yoga, Running, CrossFit, HIIT y Entrenamiento Funcional, utilizando datos de **Google Trends** desde 2019 hasta 2024.

## 📊 Objetivo del Proyecto

El objetivo principal de este proyecto es responder preguntas clave relacionadas con las tendencias de búsqueda en disciplinas de fitness, con un enfoque en:
1. Identificar las disciplinas más populares y su evolución a lo largo del tiempo.
2. Analizar patrones estacionales en las búsquedas, como los picos en enero.
3. Explorar el impacto de eventos globales, como la pandemia, en las preferencias de las personas hacia ciertas actividades de fitness.
4. Proveer información útil que pueda ser aprovechada por entrenadores personales, gimnasios y marcas deportivas.

Además, el proyecto busca familiarizar al autor con herramientas avanzadas de análisis de datos y técnicas de visualización.

---

## 📂 Estructura del Proyecto

El proyecto está organizado de la siguiente manera:

### `src/`
Contiene el código fuente del proyecto.
- **`data/`:** Incluye los datos utilizados durante el análisis.
  - `fitness_trends.csv`: Datos originales descargados desde Google Trends.
  - `cleaned_fitness_trends.csv`: Datos limpios y listos para el análisis.
- **`notebooks/`:** Notebooks de pruebas y análisis principales.
  - `EDA_Fitness_Trends.ipynb`: Notebook con el análisis exploratorio detallado.
- **`utils/`:** Módulos auxiliares para funciones específicas.
  - `data_cleaning.py`: Función para la limpieza y preprocesamiento de datos.
- **`memoria.ipynb`:** Notebook que resume de forma ordenada y clara los pasos principales del análisis.

### `presentation/`
Carpeta destinada a la presentación del proyecto.
- `Tendencias_Salud_Fitness_Final.pptx`: Presentación en formato PowerPoint para resumir el análisis y las conclusiones.

---

## 🛠️ Herramientas Utilizadas

Este proyecto utiliza las siguientes herramientas y tecnologías:

- **Python:** Para el análisis y la visualización de datos.
  - **Librerías principales:**
    - `pandas`: Manipulación de datos.
    - `matplotlib` y `seaborn`: Visualización de gráficos.
    - `pytrends`: Extracción de datos desde Google Trends.
- **Google Trends:** Fuente de datos utilizada para medir la popularidad relativa de los términos de búsqueda.
- **PowerPoint:** Para crear una presentación clara y visualmente atractiva con los resultados obtenidos.

---

## 📈 Análisis y Resultados

### **1. Evolución Temporal**
El análisis temporal mostró las siguientes observaciones clave:
- **Running:** La disciplina más estable y popular, con búsquedas constantes a lo largo del tiempo.
- **Yoga:** Muestra picos significativos, especialmente en enero, debido a resoluciones de año nuevo.
- **CrossFit y HIIT:** Presentan un menor volumen de búsquedas, lo que indica que son disciplinas más de nicho.

### **2. Comparativa Promedio**
El análisis de promedios reveló lo siguiente:
- **Running:** Promedio de popularidad más alto (75.33), seguido de Yoga (48.49).
- **HIIT:** Con un promedio de 2.23, muestra su posición como disciplina emergente pero de menor alcance.
- **Entrenamiento Funcional:** Sin búsquedas significativas en este conjunto de datos.

### **3. Patrones Estacionales**
Un mapa de calor estacional destacó los siguientes puntos:
- Enero es un mes clave con picos significativos para Yoga y CrossFit.
- Running es más estable, pero muestra un leve incremento en primavera, probablemente relacionado con el clima favorable.

### **4. Impacto de la Pandemia**
El análisis del período 2020-2021 mostró:
- **Yoga:** Incremento notable durante el confinamiento debido a su adaptabilidad como ejercicio doméstico.
- **HIIT y CrossFit:** No experimentaron aumentos significativos, posiblemente debido a su dependencia de equipos y entrenamientos grupales.

---

## 🚀 Próximos Pasos

Este proyecto puede expandirse con los siguientes análisis y mejoras:
1. **Análisis Regional:** Explorar diferencias geográficas en las búsquedas para entender las preferencias locales.
2. **Cruzar Datos Externos:** Incorporar datos como clima, eventos globales o indicadores económicos para encontrar correlaciones.
3. **Ampliar el Rango Temporal:** Analizar datos anteriores a 2019 para identificar tendencias históricas.
4. **Explorar Nuevas Disciplinas:** Incluir términos relacionados con fitness emergente como calistenia o entrenamiento en realidad virtual.

---


