# Análisis de Datos de Conflictos en México con `dplyr`

Este notebook proporciona una introducción básica al análisis de datos en R utilizando el paquete `dplyr`. Está diseñado para personas que no están familiarizadas con Jupyter Notebook o R.

## ¿Qué es un Jupyter Notebook?
Un Jupyter Notebook es una aplicación web que permite crear y compartir documentos que contienen código en vivo, ecuaciones, visualizaciones y texto narrativo. Se utiliza para limpieza y transformación de datos, simulación numérica, modelado estadístico, visualización de datos, aprendizaje automático, y mucho más.

## ¿Cómo usar este Notebook?
- Para ejecutar una celda de código, haz clic en ella y luego presiona `Shift + Enter`.
- Puedes modificar el código y volver a ejecutar la celda para ver los resultados actualizados.
- Es recomendable ejecutar las celdas en el orden en que se presentan.

### Instrucciones para Configuración e Importación de Datos
En este paso, cargaremos las librerías necesarias y luego importaremos los datos del archivo CSV. Observaremos las primeras filas de la base de datos para familiarizarnos con su estructura.

## Configuración e Importación de Datos
```R
# Cargar las librerías necesarias
library(dplyr)
library(readr)

# Importar la base de datos
datos_conflicto <- read_csv('conflict_data_mex.csv')

# Visualizar las primeras filas de la base de datos
head(datos_conflicto)
```

### Instrucciones para `select`
Aquí seleccionaremos columnas específicas de la base de datos para simplificar nuestro análisis. Nos enfocaremos en el año del conflicto, el tipo de violencia, y el número de muertes.

## Selección de Columnas con `select()`
```R
# Seleccionar solo las columnas de interés: año, tipo de violencia, y número de muertes
conflicto_seleccionado <- select(datos_conflicto, year, type_of_violence, deaths_a, deaths_b, deaths_civilians, deaths_unknown)

# Ver las primeras filas de los datos seleccionados
head(conflicto_seleccionado)
```

### Instrucciones para `filter`
En este paso, filtraremos los datos para enfocarnos en un tipo específico de violencia. Por ejemplo, podemos elegir analizar solo los conflictos de tipo político.

## Filtrado de Datos con `filter()`
```R
# Filtrar para obtener datos de un tipo específico de violencia, por ejemplo, violencia política (tipo 1)
conflicto_politico <- filter(conflicto_seleccionado, type_of_violence == 1)

# Ver las primeras filas de los datos filtrados
head(conflicto_politico)
```

### Instrucciones para `mutate`
Aquí crearemos una nueva columna que represente el total de muertes en cada incidente, sumando las muertes de cada categoría reportada.

## Creación de Nuevas Variables con `mutate()`
```R
# Agregar una nueva columna que indique el total de muertes
conflicto_mutado <- mutate(conflicto_politico, total_muertes = deaths_a + deaths_b + deaths_civilians + deaths_unknown)

# Ver las primeras filas de los datos mutados
head(conflicto_mutado)
```

### Instrucciones para `group_by` y `summarize`
Finalmente, agruparemos los datos por año y utilizaremos la función `summarize` para calcular el total de muertes por año, proporcionando una visión general de la severidad de los conflictos a lo largo del tiempo.

## Agrupación y Resumen con `group_by()` y `summarize()`
```R
# Agrupar por año y contar el número total de muertes por año
resumen_muertes <- conflicto_mutado %>%
  group_by(year) %>%
  summarize(total_muertes_anuales = sum(total_muertes, na.rm = TRUE))

# Ver el resumen
head(resumen_muertes)
```

## Notas Finales
Este notebook utiliza la base de datos 'conflict_data_mex.csv' para un análisis básico. Asegúrate de tener el archivo en el mismo directorio que este notebook.