<img src="logo.png">

# Posiciones y escalas

En lecciones previas aprendimos sobre posicionar elementos, por ejemplo textos, en un gráfico. O bien, dar "escalofríos" a los datos graficados (como con ``geom_jitter``).

En este capítulo veremos mas formas de hacer cambios en posiciones. Además aprenderemos sobre una familia de capas especiales llamadas escalas.

## Posiciones

Ya hemos tenido oportunidad de lidiar con el manejo de superposiciones, ya sea corregir utilizando transparencias o escalofríos.

Por su parte, cada geometría tiene un parámetro llamado ``position`` el cual también nos permite lidiar con superposiciones. Propiamente dicho, nos permite colocar la representación de cada dato con una posición especial.

El parámetro de posición usualmente viene dado por una palabra (como ``position="identity"``), pero veremos que en realidad existen funciones especiales para mejorar su rendimiento.

### position_identity

Este tipo de posición no requiere ningún ajuste. Simplemente sirve para indicar que, de hecho, no se haga ningún ajuste en la posición de los datos. Viene dado por default en algunas geometrías como la de puntos o la de líneas. Por ejemplo, es lo mismo escribir 

```r
ggplot(data=...,mapping=...) +
    geom_point(position=position_identity())
```

que simplemente escribir

```r
ggplot(data=...,mapping=...) +
    geom_point()
```



### position_jitter

Como su nombre lo indica, sirve para dar escalofríos. En este sentido, es lo mismo hacer 

```r
ggplot(data=...,mapping=...) +
    geom_point(position=position_jitter())
```

que simplemente escribir

```r
ggplot(data=...,mapping=...) +
    geom_jitter()
```

No obstante, `position_jitter()` tiene a su vez tres parámetros: ``seed``, ``width`` y ``height``. El parámetro ``seed`` sirve para fijar la aleatoriedad del escalofrío y siempre es un número. Los parámetros ``width`` y ``height`` son para controlar los movimientos horizontales y verticales.

Por ejemplo, ejecutemos el siguiente código:

```r
ggplot(data=mpg,mapping=aes(x=placas,y=Magnitud)) +
    geom_point(position=position_jitter())
```

<img src="im101.png">

Vamos a volver a ejecutarlo:

```r
ggplot(data=mpg,mapping=aes(x=placas,y=Magnitud)) +
    geom_point(position=position_jitter())
```

<img src="im102.png">

Se observa que, aunque el código es el mismo, no se obtiene el mismo gráfico.

Esto se debe a que el ruido (el escalofrío) que se le añade a cada dato es un número aleatorio. En cambio, si fijamos la semilla ``seed``, el efecto aleatorio estará controlado.

```r
################################################################
#######       En R       #######################################
################################################################

ggplot(data=mpg,mapping=aes(x=placas,y=Magnitud)) +
    geom_point(position=position_jitter(seed=123))
```

```python
################################################################
#######    En Python     #######################################
################################################################

ggplot(data=mpg,mapping=aes(x=placas,y=Magnitud)) +
    geom_point(position=position_jitter(random_state=123))
```


<img src="im103.png">

### position_nudge()

Otra posición importante es la nudge. Como su nombre lo indica, sirve para *empujar* los datos. Esta es especialmente útil con la geometría de texto.

```r
################################################################
#######       En R       #######################################
################################################################

df = data.frame(x=1:5,y=1:5,lab=c("a","b","c","d","e"))

ggplot(data=df,mapping=aes(x=x,y=x,color="ligthblue")) +
    geom_point() +
    geom_text(mapping=aes(label=lab))
```

```python
################################################################
#######    En Python     #######################################
################################################################

df = pd.DataFrame({
    'x': [1, 2, 3, 4, 5],
    'y': [1, 2, 3, 4, 5],
    'lab': ["a", "b", "c", "d", "e"]
})

(ggplot(df, aes(x='x', y='y')) +
     geom_point(color="lightblue", size=4) +
     geom_text(aes(label='lab')))
```

<img src="im104.png">


Podemos mover los textos de lugar utilizando ``position_nudge``

```r
ggplot(df, aes(x=x, y=y)) +
     geom_point(color="lightblue", size=4) +
     geom_text(aes(label=lab),
               position = position_nudge(x=0.5,y=0.4))
```

<img src="im105.png">

### posiciones stack y fill 

Hablemos ahora de dos tipos de posiciones íntimamente relacionadas entre sí: ``position_stack`` y ``position_fill``. Estas son muy útiles cuando trabajamos con gráficos de barras (que veremos más adelante). De hecho, la geometría de barras tiene como posición por default a stack (pilas).

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + #en Python es "factor(cyl)"
  geom_bar(alpha=0.5)
```

<img src="im106.png">



Cambiemos la posición a identidad

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + #en Python es "factor(cyl)"
  geom_bar(alpha=0.5,position="identity")
```

<img src="im107.png">

Por otra parte, `position_fill` nos devolverá nuevamente las barras apiladas pero normalizadas al 100%

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + #En Python es "factor(cyl)"
  geom_bar(alpha=0.5,position=position_fill())
```

<img src="im108.png">


El `position_fill` tiene por default un parámetro llamado ``reverse`` que es falso por defecto. Si se cambia a verdadero, se invierte el orden de las pilas:

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + 
  geom_bar(alpha=0.5,position=position_fill(reverse=TRUE)) #En Python es "reverse=True"
```

<img src="im109.png">

Conviene preguntarse cuál es el efecto de utilizar un ``position_stack`` en geometrías como la de puntos o la de líneas.

### dodge

Otra posición muy útil para los gráficos de barras es la de dodge (esquivar). Lo que hace es colocar cada barra junto a la otra.


```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + 
  geom_bar(alpha=0.5,position=position_dodge()) 
```

<img src="im110.png">

Podemos especificar dos parámetros para mejorar la presentación: ``width`` y ``preserve``. El parámetro ``width`` controla el ancho del empuje y el parámetro ``preserve`` controla el ancho de las columnas solitarias.

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + 
  geom_bar(alpha=0.5,position=position_dodge(width=1.2))
```
<img src="im111.png">

```r
ggplot(data=mpg,mapping=aes(x=factor(cyl),fill=drv)) + 
  geom_bar(alpha=0.5,position=position_dodge(preserve="single")) #por default es preserve="total"
```
<img src="im112.png">