<a href="https://colab.research.google.com/github/ElenaVillano/visualizacionR/blob/main/notebooks/s2-graphs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Taller de visualización de datos sesión 1 (parte 2)

### Por Elena Villalobos



## 1. Paquetes

In [None]:
# Packages
# - ggplot
# - tidyverse
library(tidyverse)

## 2. Primeros pasos:

  - Tener el contexto de la base de datos
  - Hacernos preguntas de qué es lo que queremos responder con el gráfico
  - ¿Comparaciones entre el rendimiento de los coches?

### 2.1 Datos de carros

Lista de carros con características de su diseño

  - mpg - millas por galón
  - cyl - número de cilindros
  - disp - desplazamiento
  - hp - caballos de fuerza, brutos
  - drat - relacion del eje trasero
  - wt - peso
  - qsec - tiempo de 1/4 de milla
  - vs - forma de motor (forma V o recto)
  - am - tipo de transmisión (automático o manual)
  - gear - número de engranajes
  - carb - número de carburadores

In [None]:
mtcars

In [None]:
head(mtcars)

In [None]:
tail(mtcars)

## 3. Graficadondo con ggplot2

- Paquete que viene incluido en Tidyverse
- Trabaja mucho mejor con datos en formato largo *long formart*: una columna para cada variable, y una observación para cada fila***
- Mejor datos bien estructurados
- Utiliza un formato de graficación donde se van agregando **por capas** nuevos elementos



### 3.1 Estructura básica para graficar:

```
ggplot(data = <DATA>, mapping = aes(<MAPPINGS>)) +  
      <GEOM_FUNCTION>()

ggplot(data = <DATA>) +
  <GEOM_FUNCTION>(mapping = aes(<MAPPINGS>))
```

#### 3.1.1 ggplot()

En la primera parte de la función se está vinculando el plot a un dataframe.

In [None]:
ggplot(data = mtcars)

#### 3.1.2 aes()

En la segunda parte estamos, estamos definiendo el mapeo estético del plot `aes`, seleccionando las variables que graficaremos y cómo la queremos presentar en el gráfico.

- Posición *x* o *y*
- Tamaño
- Forma
- Color

In [None]:
ggplot(data = mtcars, mapping = aes(x = mpg , y = hp ))

#### 3.1.3 geom_algo

Se agregan funciones de `geoms` que son representaciones gráficas de los datos en el plot, existen muchas pero hoy nos enfocaremos en las que sigue:

  - `geom_point()`
  - `geom_boxplot()`
  - `geom_line()`

Para agregar esta función se utiliza el signo de +

In [None]:
ggplot(data = mtcars, mapping = aes(x = mpg , y = hp )) +
  geom_point()

Debido a que ggplot trabaja en capas, puedes tener templates de gráficos e ir dibujando sobre objetos

In [None]:
comp1 <- ggplot(data = mtcars, mapping = aes(x = mpg , y = hp ))

In [None]:
comp1 +
  geom_point()

Aquí ya es donde comenzamos a agregar funciones adicionales para que se vean mejor los gráficos.

In [None]:
comp1 +
  geom_point(color = 'blue')

**Ejercicio 1:**

Realiza la comparación entre el desplazamiento y tiempo en millas.

### 3.2 Agregar información

- Agregar otra variable
- Acomodo de código

In [None]:
# Tipo de coche
ggplot(data = mtcars, mapping = aes(x = mpg , y = hp, color = am )) +
  geom_point()

In [None]:
# Diferente orden para graficar lo mismo
ggplot(data = mtcars) +
  geom_point(mapping = aes(x = mpg , y = hp, color = am ))

### 3.3 Tipos de variables al graficar

In [None]:
# Como factor
ggplot(data = mtcars) +
  geom_point(mapping = aes(x = mpg , y = hp, color = as.factor(am)))

- Limpiar la base de datos de antemano para no tener problemas.

In [None]:
# Tomando solo la variable de am
mtcars$am

In [None]:
typeof(mtcars$am)

In [None]:
# Si la queremos hacer factor:
as.factor(mtcars$am)

In [None]:
# Asignación de la misma variable transformada a la base de datos
mtcars$am <- as.factor(mtcars$am)

In [None]:
typeof(mtcars$am)

In [None]:
head(mtcars)

Ahora si sabemos de antemano que hay variables que sabemos que son categóricas, las podemos modificar con el siguiente código

In [None]:
# Cuáles son la que deben ser categóricas
varfac <- c('vs','gear','carb')

In [None]:
# datos[filas, columnas]
mtcars[1,]

In [None]:
mtcars[,2]

In [None]:
mtcars$cyl

In [None]:
# function: lapply
mtcars[,varfac] <- lapply(mtcars[,varfac], factor)

In [None]:
mtcars[,varfac]