# Análisis de Datos: Patrones de Carga de Vehículos Eléctricos

## Universidad de La Sabana  
**Maestría en Analítica de Datos**  
Materia: **Métodos Estadísticos Avanzados 1**

### Introducción

Este análisis tiene como objetivo explorar y entender los patrones de carga de vehículos eléctricos utilizando la base de datos disponible en Kaggle: [Electric Vehicle Charging Patterns](https://www.kaggle.com/datasets/valakhorasani/electric-vehicle-charging-patterns). La base de datos incluye información relevante que nos permitirá aplicar diversas técnicas estadísticas vistas en el curso para extraer conclusiones significativas sobre los hábitos y comportamientos de carga de vehículos eléctricos.

### Objetivo General

Analizar los patrones de carga de vehículos eléctricos para determinar cómo las diferentes variables cuantitativas y cualitativas afectan el comportamiento de carga de los usuarios.

### Objetivos Específicos

1. Determinar si existen diferencias significativas en los tiempos de carga en función de diferentes tipos de estaciones de carga.
2. Evaluar los factores que influyen en la duración y frecuencia de las sesiones de carga.

### Metodología

Para realizar este análisis, se ha seguido la siguiente metodología:

1. **Selección y Limpieza de Datos**: La base de datos contiene más de 200 observaciones, con al menos 5 variables cuantitativas y 4 cualitativas. Se realizó una limpieza inicial para eliminar valores atípicos y datos faltantes.
2. **Análisis Descriptivo**: Se realizaron análisis descriptivos tanto analíticos como gráficos utilizando **ggplot2** para visualizar patrones importantes.
3. **Estimación y Pruebas de Hipótesis**: Se seleccionaron algunas variables relevantes y se realizaron pruebas de hipótesis e intervalos de confianza para evaluar relaciones y tendencias entre los datos.

### Selección y Limpieza de Datos

- Se seleccionó una muestra del **70%** de los datos originales, garantizando una muestra representativa para el análisis.
- Se limpiaron las observaciones eliminando registros con valores faltantes en variables importantes y se transformaron variables categóricas en factores para su análisis adecuado.

### Análisis Descriptivo

#### Variables Cuantitativas

- **Duración de la carga**: Variable continua que mide el tiempo de carga en minutos.
- **Energía consumida**: Variable continua que mide la cantidad de energía en kWh.
- **Distancia recorrida**: Distancia recorrida antes de la siguiente sesión de carga.
- **Costo de la carga**: Costo de cada sesión de carga.

#### Variables Cualitativas

- **Tipo de estación de carga**: Pública, privada, rápida, estándar.
- **Ubicación de la estación**: Ciudad, rural.
- **Tipo de vehículo**: Sedan, SUV, camioneta, compacto.

Para cada una de estas variables, se realizaron análisis de frecuencias y visualizaciones con **ggplot2** para observar la distribución y tendencias principales.

### Visualización de Datos

Las visualizaciones incluyen:
- **Histograma** de la duración de las sesiones de carga para observar su distribución.
- **Boxplot** del costo de la carga agrupado por tipo de estación para identificar diferencias significativas.
- **Gráfico de barras** para el tipo de vehículo y la frecuencia de uso de estaciones de carga.

```r
# Ejemplo de visualización
library(ggplot2)
ggplot(data, aes(x = tipo_estacion, y = costo_carga)) +
  geom_boxplot() +
  labs(title = "Costo de la Carga según el Tipo de Estación",
       x = "Tipo de Estación",
       y = "Costo de la Carga (USD)")
```

### Estimación y Pruebas de Hipótesis

- **Estimación del Intervalo de Confianza (IC)**: Se calculó el intervalo de confianza para la media del tiempo de carga de vehículos en estaciones públicas.
- **Prueba de Hipótesis**: Se realizó una prueba de hipótesis para evaluar si existe una diferencia significativa en la energía consumida entre estaciones públicas y privadas.

### Resultados

- Las estaciones de carga rápidas presentan un costo promedio significativamente mayor que las estaciones estándar.
- La duración de la carga depende en gran medida de la ubicación de la estación, siendo más corta en áreas urbanas.

### Conclusiones

- Se identificó que el tipo de estación y la ubicación influyen considerablemente en el comportamiento de los usuarios al cargar sus vehículos eléctricos.
- Las estaciones de carga rápida son preferidas en áreas urbanas, a pesar de su costo más alto, debido a la conveniencia que ofrecen.

### Anexos

- Gráficas adicionales y tablas con estadísticas descriptivas.

### Bibliografía

- Valakhorasani, Kaggle Dataset: [Electric Vehicle Charging Patterns](https://www.kaggle.com/datasets/valakhorasani/electric-vehicle-charging-patterns).

### Cibergrafía

- Documentación de **ggplot2**: [https://ggplot2.tidyverse.org](https://ggplot2.tidyverse.org)
