# **Análisis de Bellabeat - Proyecto Kaggle**

Este cuaderno es parte del Proyecto Final del Curso de Análisis de Datos de Google. El objetivo es analizar datos de dispositivos inteligentes para entender mejor los hábitos de los usuarios. Estos análisis ayudarán a Bellabeat a tomar decisiones informadas sobre sus productos y estrategias de marketing.

## Preguntas Clave del Proyecto
- ¿Cuáles son los patrones de actividad física y de sueño de los usuarios?
- ¿Cómo varía la actividad a lo largo del día y la semana?
- ¿Existen tendencias en el consumo de calorías y la intensidad del ejercicio?
- ¿Cuáles son las métricas más relevantes para determinar el comportamiento saludable de los usuarios?

El proyecto se llevará a cabo en fases, comenzando por la **preparación de los datos** hasta la **visualización de los resultados**.


## **Configuración del Entorno y Librerías**

En esta sección, instalaremos y cargaremos las librerías necesarias para manipular y visualizar los datos.


In [None]:
# Instalar y cargar las librerías necesarias
install.packages("tidyverse")  # Colección de paquetes para manipulación y visualización de datos
install.packages("skimr")      # Resumen rápido de datos
install.packages("janitor")    # Limpieza de datos (nombres de columnas)

# Cargar las librerías
library(tidyverse)  # metapackage de todas las librerías del tidyverse (dplyr, ggplot2, tidyr, etc.)
library(skimr)      # Para obtener un resumen detallado de los datos
library(janitor)    # Para limpiar nombres de columnas

# Documentación:
# - tidyverse: Nos proporciona una serie de herramientas para trabajar con datos (manipulación y visualización).
# - skimr: Permite obtener un resumen detallado de las variables.
# - janitor: Limpia los nombres de las columnas, haciéndolos más consistentes.


## **Carga y Verificación de Datos**

A continuación, configuraremos la ruta base para los archivos y listaremos los archivos disponibles para asegurarnos de que todo está en orden antes de comenzar a cargar los datos.


In [None]:
# Almacenar la ruta base en una variable
ruta_base <- "../input/fitbit/mturkfitbit_export_3.12.16-4.11.16/Fitabase Data 3.12.16-4.11.16"

# Listar los archivos y subcarpetas dentro de la ruta base
list.files(path = ruta_base, recursive = TRUE)


## **Carga de Archivos CSV**

Vamos a cargar los archivos CSV en variables separadas para trabajar con cada dataset por separado.


In [None]:
# Cargar los archivos CSV utilizando la variable de ruta correctamente
daily_activity <- read_csv(file.path(ruta_base, "dailyActivity_merged.csv"), show_col_types = FALSE)
heartrate <- read_csv(file.path(ruta_base, "heartrate_seconds_merged.csv"), show_col_types = FALSE)
hourly_calories <- read_csv(file.path(ruta_base, "hourlyCalories_merged.csv"), show_col_types = FALSE)
hourly_intensities <- read_csv(file.path(ruta_base, "hourlyIntensities_merged.csv"), show_col_types = FALSE)
hourly_steps <- read_csv(file.path(ruta_base, "hourlySteps_merged.csv"), show_col_types = FALSE)
minute_calories <- read_csv(file.path(ruta_base, "minuteCaloriesNarrow_merged.csv"), show_col_types = FALSE)
minute_intensities <- read_csv(file.path(ruta_base, "minuteIntensitiesNarrow_merged.csv"), show_col_types = FALSE)
minute_mets <- read_csv(file.path(ruta_base, "minuteMETsNarrow_merged.csv"), show_col_types = FALSE)
minute_sleep <- read_csv(file.path(ruta_base, "minuteSleep_merged.csv"), show_col_types = FALSE)
minute_steps <- read_csv(file.path(ruta_base, "minuteStepsNarrow_merged.csv"), show_col_types = FALSE)
weight_log <- read_csv(file.path(ruta_base, "weightLogInfo_merged.csv"), show_col_types = FALSE)

# Documentación:
# - Cada archivo CSV se carga en una variable separada, con un nombre descriptivo que corresponde a su contenido.
# - Utilizamos la función `read_csv` para importar cada archivo correctamente construyendo la ruta.


## Exploración Inicial de Datos

Verificaremos las primeras filas de cada dataset para tener una idea inicial de cómo están organizados los datos y su estructura.


In [None]:
# Exploración inicial: Ver las primeras filas de cada dataset
head(daily_activity)
head(heartrate)
head(hourly_calories)
head(hourly_intensities)
head(hourly_steps)
head(minute_calories)
head(minute_intensities)
head(minute_mets)
head(minute_sleep)
head(minute_steps)
head(weight_log)

# Documentación:
# - `head()`: Nos muestra las primeras filas de cada dataset para entender la estructura de los datos.

## **Resumen Estadístico Básico**

En esta sección, se mostrarán estadísticas rápidas para cada dataset utilizando la función `summary()`.


In [None]:
# Ver las estructuras de los datasets cargados
str(daily_activity)
str(heartrate)
str(hourly_calories)
str(hourly_intensities)
str(hourly_steps)
str(minute_calories)
str(minute_intensities)
str(minute_mets)
str(minute_sleep)
str(minute_steps)
str(weight_log)

# Resumen estadístico básico usando summary() para obtener estadísticas rápidas
summary(daily_activity)
summary(heartrate)
summary(hourly_calories)
summary(hourly_intensities)
summary(hourly_steps)
summary(minute_calories)
summary(minute_intensities)
summary(minute_mets)
summary(minute_sleep)
summary(minute_steps)
summary(weight_log)

# Documentación:
# - `summary()`: Resumen estadístico que incluye medias, medianas, valores mínimos y máximos.

## **Análisis Detallado con skim()**

Utilizaremos la función `skim()` para obtener una visión más detallada de cada columna en los datasets.


In [None]:
# Resumen detallado con skim() de la librería skimr
skim(daily_activity)
skim(heartrate)
skim(hourly_calories)
skim(hourly_intensities)
skim(hourly_steps)
skim(minute_calories)
skim(minute_intensities)
skim(minute_mets)
skim(minute_sleep)
skim(minute_steps)
skim(weight_log)

# Documentación:
# - `skim()`: Proporciona una visión detallada de cada columna, incluyendo cantidad de valores nulos, distribución y tipos de datos.