
#Análisis Exploratorio de Datos (EDA) con `dlookr` en R

Esta guía proporciona una explicación detallada para realizar un Análisis Exploratorio de Datos (EDA) utilizando el paquete `dlookr` en R. Incluye pasos para crear informes automatizados, opciones avanzadas y una descripción de las funciones disponibles para el análisis de datos.

---

## Instalación y Configuración

Para comenzar, instala y carga los paquetes necesarios:

```r
# Instalar paquetes
install.packages("dlookr")
install.packages("dplyr")  # Recomendado para manipulación de datos

# Cargar paquetes
library(dlookr)
library(dplyr)
```

---

## Cargar el Conjunto de Datos

Carga tu conjunto de datos en un data frame. Reemplaza `'tus_datos'` con el nombre de tu archivo o data frame:

```r
# Cargar datos
datos <- tus_datos
```

---

## Diagnóstico de Calidad de Datos

Evalúa la calidad de los datos para identificar valores perdidos, únicos y otros posibles problemas:

```r
# Diagnóstico de datos
diagnostico <- diagnose(datos)
print(diagnostico)
```

Genera un informe detallado en formato HTML:

```r
# Informe de diagnóstico
diagnose_report(datos, output_format = "html", output_file = "diagnostico_datos.html")
```

---

## Análisis Descriptivo de Variables Numéricas

Obtén estadísticas descriptivas de las variables numéricas:

```r
# Descripción de datos numéricos
descripcion <- describe(datos)
print(descripcion)
```

---

## Prueba de Normalidad

Evalúa si las variables numéricas siguen una distribución normal:

```r
# Prueba de normalidad
normalidad <- normality(datos)
print(normalidad)

# Visualización de normalidad
plot_normality(datos)
```

---

## Análisis de Correlación

Calcula y visualiza la matriz de correlación entre variables numéricas:

```r
# Matriz de correlación
correlacion <- correlate(datos)
plot(correlacion)
```

---

## Definir la Variable Objetivo y Analizar Relaciones

Si tienes una variable objetivo, defínela y analiza su relación con otras variables:

```r
# Definir variable objetivo
datos <- target_by(datos, variable_objetivo)

# Analizar relaciones
relaciones <- relate(datos)
print(relaciones)

# Visualizar relaciones
plot(relaciones)
```

Reemplaza `'variable_objetivo'` con el nombre de tu variable objetivo.

---

## Generación de Informes Automatizados

### Informe Completo con `eda_paged_report`

Crea un informe automatizado y estático que incluye análisis detallados:

```r
# Crear un informe EDA completo
eda_paged_report(
  datos,
  target = "variable_objetivo",       # Variable objetivo (opcional)
  output_format = "html",             # Formato del informe: "html" o "pdf"
  output_file = "informe_eda.html",   # Nombre del archivo de salida
  output_dir = getwd(),               # Directorio de salida
  title = "Informe de Análisis Exploratorio de Datos",  # Título del informe
  subtitle = "Descripción del conjunto de datos",       # Subtítulo del informe
  author = "Nombre del Autor",        # Autor del informe
  abstract = "Este informe proporciona un análisis exploratorio detallado del conjunto de datos.",  # Resumen
  theme = "blue"                      # Tema del informe: "orange" o "blue"
)
```

### Informe Dinámico con `eda_web_report`

Genera un informe interactivo en formato HTML para explorar dinámicamente los datos:

```r
# Crear un informe EDA dinámico
eda_web_report(
  datos,
  target = "variable_objetivo",       # Variable objetivo (opcional)
  output_file = "informe_eda_web.html", # Nombre del archivo de salida
  output_dir = getwd(),               # Directorio de salida
  title = "Informe EDA Interactivo",  # Título del informe
  subtitle = "Exploración Dinámica de Datos",  # Subtítulo del informe
  theme = "blue"                      # Tema del informe
)
```

---

## Exploratory Data Analysis (Funciones Específicas)

El paquete `dlookr` ofrece diversas funciones para el análisis exploratorio de datos:

- `describe()`: Proporciona estadísticas descriptivas de datos numéricos.
- `normality()` y `plot_normality()`: Realizan pruebas de normalidad y visualización de datos numéricos.
- `correlate()` y `plot.correlate()`: Calculan coeficientes de correlación y generan visualizaciones entre dos variables numéricas.
- `target_by()`: Define una variable objetivo para análisis adicionales.
- `relate()`: Describe la relación entre la variable objetivo y otras variables de interés.
- `plot.relate()`: Visualiza relaciones entre la variable objetivo y otras variables.
- `eda_report()`: Realiza un análisis exploratorio completo y genera un informe de resultados.

---

## Recursos Adicionales

Para más detalles, consulta la [documentación oficial de `dlookr`](https://cran.r-project.org/web/packages/dlookr/vignettes/EDA.html).
