# Escalas, ejes y leyendas

La codificación visual &ndash; llevar los datos a variables visuales como la posición, el tamaño o el color &ndash; es el corazón de la visualización de datos. El caballo de batalla encargado de realizar este tarea es la *escala (scale)*: una función que toma un valor de los datos como entrada (la escala *dominio (domain)*) y devuelve un valor visual &ndash; posición de un píxel o color RGB &ndash; como salida (la escala *rango (range)*).  ¡Por supuesto, una visualización es inútil si nadie entiende lo que transmite! Además de los marcadores, un gráfico necesita elementos de referencia, o *guías (guides)*, que permitan a los lectores decodificar el gráfico. Guías como *ejes (axes)*, que visualizan escalas con rangos espaciales, y *leyendas (legends)*, que visualizan escalas con rangos de color, tamaño o forma; son las heroínas no reconocidas de la visualización de datos efectiva.

En este *notebook*, exploraremos las opciones que Altair ofrece para apoyar diseños personalizados por medio de la escala, los ejes y las leyendas, utilizando un ejemplo sobre la efectividad de los antibióticos.

_Este notebook es una traduccion y modificación del notebook **"Introduction to Vega-Lite / Altair"** , el cual es parte de [data visualization curriculum](https://github.com/uwdata/visualization-curriculum)._

_Todos los notebooks en español se encuentran en: [Altair en Simplificando Datos](https://github.com/SimplificandoDatos/Altair)_

In [1]:
import pandas as pd
import altair as alt

## Datos de antibióticos

Después de la Segunda Guerra Mundial, los antibióticos se consideraron "medicamentos milagrosos", ya que eran un remedio fácil para lo que habían sido dolencias intratables. Para saber qué medicamento funcionó de manera más efectiva para cuál infección bacteriana, se recopiló su rendimiento en 16 bacterias de los tres antibióticos más populares.

Usaremos un conjunto de datos de antibióticos de la [colección vega-datasets](https://github.com/vega/vega-datasets). En los siguientes ejemplos, pasaremos la URL directamente a Altair:

In [2]:
from vega_datasets import data
antibiotics = data.burtin.url

Primero cargaremos los datos con Pandas para ver el conjunto de datos en su totalidad y familiarizarnos con los campos disponibles:

In [3]:
pd.read_json(antibiotics)

Unnamed: 0,Bacteria,Genus,Gram_Staining,Neomycin,Penicillin,Streptomycin
0,Aerobacter aerogenes,other,negative,1.6,870.0,1.0
1,Bacillus anthracis,other,positive,0.007,0.001,0.01
2,Brucella abortus,other,negative,0.02,1.0,2.0
3,Diplococcus pneumoniae,other,positive,10.0,0.005,11.0
4,Escherichia coli,other,negative,0.1,100.0,0.4
5,Klebsiella pneumoniae,other,negative,1.0,850.0,1.2
6,Mycobacterium tuberculosis,other,negative,2.0,800.0,5.0
7,Proteus vulgaris,other,negative,0.1,3.0,0.1
8,Pseudomonas aeruginosa,other,negative,0.4,850.0,2.0
9,Salmonella (Eberthella) typhosa,Salmonella,negative,0.008,1.0,0.4


Los valores numéricos de la tabla indican la [concentración mínima inhibitoria (MIC)](https://es.wikipedia.org/wiki/Concentraci%C3%B3n_inhibitoria_m%C3%ADnima), una medida de la eficacia del antibiótico, que representa la concentración del antibiótico (en microgramos por mililitro) necesaria para prevenir el crecimiento in vitro. La reacción de la bacteria a un procedimiento llamado [Gram staining o Tinción de Gram](https://es.wikipedia.org/wiki/Tinci%C3%B3n_de_Gram) se describe mediante el campo nominal `Gram_Staining`. La bacteria que se vuelve de color azul oscuro o violeta se marca como positivo; de lo contrario, como negativo.

A medida que examinamos las diferentes visualizaciones de este conjunto de datos, pregúntate: ¿Qué podríamos aprender sobre la efectividad relativa de los antibióticos? ¿Qué podríamos aprender sobre las especies bacterianas basándonos en su respuesta a los antibióticos?

## Configurando las escalas y los ejes

### Graficando la resistencia a los antibióticos: Ajustando el tipo de la escala

Comencemos por mirar un simple gráfico de los puntos del MIC para la Neomicina (*Neomycin*).

In [4]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Podemos ver que los valores del MIC se extienden por varios órdenes de magnitud: la mayoría de los puntos se agrupan a la izquierda, con unos pocos valores atípicos grandes a la derecha._

Por defecto Altair utiliza un mapeo *lineal* (`linear`) entre los valores del dominio (MIC) y los valores del rango (píxeles). Para obtener una mejor visión general de los datos, podemos aplicar una transformación de escala diferente.

Para cambiar el tipo de escala, cambiaremos el atributo `scale`, usando el método `alt.Scale` y el parámetro `type`.

Este es el resultado de usar un tipo de escala de ráíz cuadrada (`sqrt`). Las distancias en rango de píxeles corresponde ahora a la raíz cuadrada de las distancias en el dominio de los datos.

In [5]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          scale=alt.Scale(type='sqrt'))
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Los puntos en la izquierda ahora están mejor diferenciados; pero todavía tenemos una fuerte asimetría._

Mejor usemos una [escala logarítmica](https://es.wikipedia.org/wiki/Escala_logar%C3%ADtmica) (`log`):

In [6]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          scale=alt.Scale(type='log'))
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Ahora los datos están distribuidos de manera mucho más uniforme y podemos ver las grandes diferencias en las concentraciones requeridas para las diferentes bacterias._

En una escala lineal estándar, una distancia visual (píxel) de 10 unidades podría corresponder a una *adición* de 10 unidades en el dominio de los datos. Una transformación logarítmica mapea entre la multiplicación y la suma, de tal forma que `log(u) + log(v) = log(u*v)`. Como resultado, en una escala logarítmica, una distancia visual de 10 unidades corresponde a la *multiplicación* por 10 unidades en el dominio de los datos, asumiendo un logaritmo base 10. La escala `log` usada anteriormente, indica por defecto el uso del logaritmo base 10, pero podemos ajustarlo proporcionando el parámetro `base` a la escala.

### Modificando el estilo de un eje

Las dosis más bajas indican una mayor eficacia. Sin embargo, algunas personas pueden esperar que los valores que son "mejores" estén "hacia arriba y a la derecha" dentro de un gráfico. Si queremos atender a esta convención, podemos invertir el eje para codificar la "eficacia" como una escala MIC invertida.

Para hacer esto, podemos establecer la propiedad `sort` en `'descending'` (descendente):

In [7]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'))
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Desafortunadamente el eje está empezando a ser un poco confuso: estamos trazando datos en una escala logarítmica, en la dirección inversa, y sin una indicación clara de cuáles son nuestras unidades_.

Añadamos un título más informativo al eje X: usaremos la propiedad `title` de nuestro codificador para proporcionar el texto adecuado para el título:

In [8]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


¡Mucho mejor!
Por defecto, Altair coloca el eje X en el fondo de la gráfica. Para cambiar este comportamiente, podemos añadir un atributo `axis` con `orient='top'`:

In [9]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          axis=alt.Axis(orient='top'),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


De forma similar, por defecto el eje Y tiene su orientación hacia la izquierda (`'left'`), pero puede ajustarse  a la derecha (`'right'`).

### Comparación de antibióticos: Ajuste de las líneas de la cuadrícula, recuento de las marcas y dimensionamiento

_¿Cómo se compara la neomicina con otros antibióticos, como la estreptomicina y la penicilina?_

Para empezar a responder esta pregunta, podemos crear diagramas de dispersión, añadiendo una codificación del eje `y` para otro antibiótico, similar a lo que hemos venido mostrando en el eje `x` para la neomicina.

In [10]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Streptomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          title='Estreptomicina MIC (μg/ml, escala logarítmica invertida)')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Vemos que la neomicina y la estreptomicina parecen estar altamente correlacionadas, ya que las cepas bacterianas responden de manera similar a ambos antibióticos._

Sigamos adelante y comparemos la neomicina con la penicilina:

In [11]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log'),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Ahora vemos una respuesta más diferenciada: algunas bacterias responden bien a la neomicina pero no a la penicilina, y viceversa._

Aunque esta gráfica es útil, podemos mejorarla. Los ejes `x` y `y` utilizan las mismas unidades, pero tienen diferentes tamaños (el ancho del gráfico es mayor que su altura) y diferentes dominios (0.001 a 100 para el eje `x`, y 0.001 a 1,000 para el eje `y`).

Vamos a equiparar los ejes: podemos añadir ajustes explícitos de `width` (*ancho*) y `height` (*altura*) para el gráfico, y especificar dominios coincidentes usando la propiedad `domain` de la escala.

In [12]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)')
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_¡La gráfica resultante es más equilibrada y menos propensa a interpretaciones erróneas!_

Sin embargo, las líneas de la cuadrícula ahora son muy densas. Si queremos eliminar todas las líneas de la cuadrícula, podemos añadir `grid=False` al atributo `axis`. Pero, ¿Qué pasa si en su lugar queremos reducir el número de marcas, por ejemplo, incluyendo sólo líneas de cuadrícula para cada orden de magnitud?

Para cambiar el número de marcas en un eje (*ticks*), podemos especificar la propiedad objetivo `tickCount` para el objeto `Axis`. El `tickCount` es tratado como una *sugerencia* a Altair, para ser considerado junto con otros aspectos como el uso de intervalos agradables y amigables para el ser humano. Puede que no consigamos *exactamente* el número de marcas que solicitamos, pero deberíamos conseguir algo parecido.

In [13]:
alt.Chart(antibiotics).mark_circle().encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)')
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


Modificando el `tickCount` a 5, obtenemos el efecto deseado.

Nuestros puntos de la gráfica de dispersión se sienten un poco pequeños. Cambiemos el tamaño por defecto estableciendo la propiedad `size` de la marca del círculo. Este valor de tamaño es el *área* de los marcadores en términos de píxeles.

In [14]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'), 
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


Aquí hemos establecido el área de los marcadores de círculo en 80 píxeles. 

_¡Ajusta el valor como mejor te parezca!_

## Configurando el color de las leyendas

### Color por el *Gram Staining*

Antes vimos que la neomicina es más efectiva para algunas bacterias, mientras que la penicilina es más efectiva para otras. Pero, ¿cómo podemos saber qué antibiótico usar si no conocemos las especies específicas de bacterias? La Gram staining (tinción de Gram) sirve como diagnóstico para discriminar clases de bacterias.

Codifiquemos `Gram_Staining` en el canal `color` como un tipo de dato nominal:

In [15]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Gram_Staining:N')
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_¡Vemos que las bacterias Gram-positivas son las más susceptibles a la penicilina, mientras que la neomicina es más efectiva para las bacterias Gram-negativas!_

El esquema de colores anterior fue elegido automáticamente para proporcionar colores perceptiblemente distinguibles para comparaciones nominales (iguales o no iguales). Sin embargo, es posible que deseemos personalizar los colores utilizados. En este caso, la tinción de Gram resulta en [colorantes físicos distintivos: rosa para Gram-negativo, púrpura para Gram-positivo](https://es.wikipedia.org/wiki/Tinci%C3%B3n_de_Gram#/media/Archivo:Escherichia_coli_Gram.jpg).

Usemos esos colores especificando un mapeo de escala explícito desde dominio (`domain`) de los datos hasta el rango (`range`) del color:

In [16]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Gram_Staining:N',
          scale=alt.Scale(domain=['negative', 'positive'], range=['hotpink', 'purple'])
    )
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


Por defecto, las leyendas se colocan en el lado derecho de la gráfica. Al igual que con los ejes, podemos cambiar la orientación de la leyenta usando el parámetro `orient`:

In [17]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Gram_Staining:N',
          scale=alt.Scale(domain=['negative', 'positive'], range=['hotpink', 'purple']),
          legend=alt.Legend(orient='left')
    )
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


También podemos remover por completo la leyenda, especificando `legend=None`:

In [18]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Gram_Staining:N',
          scale=alt.Scale(domain=['negative', 'positive'], range=['hotpink', 'purple']),
          legend=None
    )
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


### Color por las especies

_Hasta ahora hemos considerado la efectividad de los antibióticos. Reflexionemos y hagamos una pregunta diferente: ¿qué nos puede enseñar la respuesta a los antibióticos sobre las diferentes especies de bacterias?_

Para empezar, codifiquemos `Bacteria` (un campo de datos nominales) usando el canal `color`:

In [19]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Bacteria:N')
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_¡El resultado es un poco desastrozo!_

Hay tantas bacterias únicas que Altair empieza a repetir los colores de su paleta por defecto que tiene 10 colores para valores nominales.

Para usar colores personalizados, podemos actualizar la propiedad `scale` de codificación de colores. Una opción es proporcionar valores explícitos de escala `domain` y `range` para indicar los mapeos de color precisos por valor, como hicimos anteriormente para la tinción de Gram. Otra opción es utilizar un esquema de color alternativo. Altair incluye una variedad de esquemas de color incorporados. Para obtener una lista completa, consulta la documentación [documentación de los esquemas de color de Vega](https://vega.github.io/vega/docs/schemes/#reference).

In [20]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Bacteria:N',
          scale=alt.Scale(scheme='tableau20'))
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Ahora tenemos un color único para cada bacteria, pero la gráfica sigue siendo un desastre. Entre otras cosas, la codificación no tiene en cuenta las bacterias que pertenecen al mismo género. En la gráfica anterior, las dos cepas diferentes de Salmonella tienen tonalidades muy diferentes (verde azulado y rosa), a pesar de ser primos biológicos._

Para probar un esquema diferente, también podemos cambiar el tipo de los datos de nominal a ordinal. El esquema ordinal por defecto utiliza sombras azules, pasando de claro a oscuro:

In [21]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Bacteria:O')
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Algunos de esos tonos azules pueden ser difíciles de distinguir._

Para obtener colores más diferenciados, podemos experimentar con alternativas al esquema de colores predeterminado `blues`. El esquema `viridis` hace rampas a través de la tonalidad y la luminiscencia:

In [22]:
alt.Chart(antibiotics).mark_circle(size=80).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Bacteria:O',
          scale=alt.Scale(scheme='viridis'))
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Las bacterias del mismo género ahora tienen colores más similares que antes, pero la gráfica sigue siendo confusa. Hay muchos colores, son difíciles de buscar en la leyenda con precisión, y dos bacterias pueden tener colores similares pero diferentes géneros._

### Color por el género

Tratemos de colorear por género en lugar de por bacterias. Para ello, añadiremos una transformación `calculate` que divide el nombre de la bacteria en caracteres espaciales y toma la primera palabra de la matriz resultante. A continuación, podemos codificar el campo `Genus` resultante utilizando el esquema de color `tableau20`.

(Tenga en cuenta que el conjunto de datos de antibióticos incluye un campo `Genus` precalculado, pero lo ignoraremos aquí para explorar más a fondo las transformaciones de datos de Altair).

In [23]:
alt.Chart(antibiotics).mark_circle(size=80).transform_calculate(
    Genus='split(datum.Bacteria, " ")[0]'
).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Genus:N',
          scale=alt.Scale(scheme='tableau20'))
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Hmmm..... Aunque los datos están mejor segregados por género, esta cacofonía de colores no parece particularmente útil._

_Si observamos cuidadosamente algunas de las gráficas anteriores, vemos que sólo un puñado de bacterias tienen un género compartido con otra bacteria: Salmonella, estafilococo y estreptococo. Para enfocar nuestra comparación, podríamos agregar colores sólo para estos valores de género repetidos._

Añadamos otra transformación `calculate` que tome el nombre de un género, lo guarda si es uno de los valores repetidos, y de lo contrario usa la palabra ``"Otro"``.

Además, podemos añadir codificaciones de color personalizadas utilizando matrices explícitas de `domain` y `range` para la codificación de color `scale`.


In [24]:
alt.Chart(antibiotics).mark_circle(size=80).transform_calculate(
  Split='split(datum.Bacteria, " ")[0]'
).transform_calculate(
  Genus='indexof(["Salmonella", "Staphylococcus", "Streptococcus"], datum.Split) >= 0 ? datum.Split : "Otros"'
).encode(
    alt.X('Neomycin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Neomicina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Y('Penicillin:Q',
          sort='descending',
          scale=alt.Scale(type='log', domain=[0.001, 1000]),
          axis=alt.Axis(tickCount=5),
          title='Penicilina MIC (μg/ml, escala logarítmica invertida)'),
    alt.Color('Genus:N',
          scale=alt.Scale(
            domain=['Salmonella', 'Staphylococcus', 'Streptococcus', 'Otros'],
            range=['rgb(76,120,168)', 'rgb(84,162,75)', 'rgb(228,87,86)', 'rgb(121,112,110)']
          ))
).properties(width=290, height=290)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


_Ahora tenemos una gráfica mucho más reveladora, que fue posible gracias a las personalizaciones de los ejes y la leyenda. Tómese un momento para examinar la trama de arriba. ¿Notas alguna agrupación sorprendente?_

_La región superior izquierda tiene un grupo de bacterias estreptococos rojas, pero con otras bacterias grises a su lado. Mientras tanto, hacia la mitad derecha vemos otro estreptococos rojo colocado lejos de sus "primos". ¿Podríamos esperar que las bacterias del mismo género (y por lo tanto presumiblemente más similares genéticamente) se agrupen más cerca unas de otras?_

En realidad, el conjunto de datos subyacente contiene errores. Este refleja las designaciones de especies utilizadas a principios de la década de 1950. Sin embargo, el consenso científico ha cambiado desde entonces. ¿Ese punto gris en la parte superior izquierda? ¡Ahora se considera un estreptococo! ¿Ese punto rojo hacia la mitad derecha? ¡Ya no se considera un estreptococo!

Por supuesto, por si solo, este conjunto de datos no justifica completamente estas reclasificaciones. ¡Sin embargo, los datos contienen valiosas pistas biológicas que fueron pasadas por alto durante décadas! La visualización, cuando es utilizada por un espectador debidamente capacitado e inquisitivo, puede ser una herramienta poderosa para el descubrimiento.

Este ejemplo también refuerza una lección importante: **_¡Siempre se escéptico de tus datos!_**

### Color por la respuesta del antibiótico

También podríamos usar el canal `color` para codificar los valores cuantitativos. ¡Sin embargo, ten en cuenta que normalmente el color no es tan efectivo para expresar cantidades como las codificaciones de posición o tamaño!

Aquí hay un mapa de calor básico de los valores MIC de la penicilina para cada bacteria. Usaremos un marcador `rect` y ordenaremos las bacterias en orden descendente de los valores de MIC (de mayor a menor resistencia):

In [25]:
alt.Chart(antibiotics).mark_rect().encode(
    alt.Y('Bacteria:N',
      sort=alt.EncodingSortField(field='Penicillin', op='max', order='descending')
    ),
    alt.Color('Penicillin:Q')
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


Podemos mejorar aún más este gráfico combinando las características que hemos visto hasta ahora: una escala logarítmica, un cambio de orientación de eje, un esquema de color personalizado (`plasma`), ajuste del número de marcas del eje (`tickCount`) y un texto de título personalizado. También ejercitaremos las opciones de configuración para ajustar la posición del título del eje y la alineación del título de la leyenda.

In [26]:
alt.Chart(antibiotics).mark_rect().encode(
    alt.Y('Bacteria:N',
      sort=alt.EncodingSortField(field='Penicillin', op='max', order='descending'),
      axis=alt.Axis(
        orient='right',     # orient axis on right side of chart
        titleX=7,           # set x-position to 7 pixels right of chart
        titleY=-2,          # set y-position to 2 pixels above chart
        titleAlign='left',  # use left-aligned text
        titleAngle=0        # undo default title rotation
      )
    ),
    alt.Color('Penicillin:Q',
      scale=alt.Scale(type='log', scheme='plasma', nice=True),
      legend=alt.Legend(titleOrient='right', tickCount=5),
      title='Penicillina MIC (μg/ml)'
    )
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


Alternativamente, podemos eliminar el título del eje por completo, y usar la propiedad `title` de nivel superior para añadir un título para todo el gráfico:

In [27]:
alt.Chart(antibiotics, title='Resistencia a la penicilina de las cepas bacterianas').mark_rect().encode(
    alt.Y('Bacteria:N',
      sort=alt.EncodingSortField(field='Penicillin', op='max', order='descending'),
      axis=alt.Axis(orient='right', title=None)
    ),
    alt.Color('Penicillin:Q',
      scale=alt.Scale(type='log', scheme='plasma', nice=True),
      legend=alt.Legend(titleOrient='right', tickCount=5),
      title='Penicillina MIC (μg/ml)'
    )
).configure_title(
  anchor='start', # anchor and left-align title
  offset=5        # set title offset from chart
)

<VegaLite 3 object>

If you see this message, it means the renderer has not been properly enabled
for the frontend that you are using. For more information, see
https://altair-viz.github.io/user_guide/troubleshooting.html


## Resumen

Integrando lo que hemos aprendido en los *notebooks* hasta ahora sobre codificaciones, transformaciones de datos y personalización, ahora deberías estar preparado para crear una amplia variedad de gráficos estadísticos. ¡Ahora puedes poner Altair en uso diario para explorar y comunicar datos!

¿Interesado en aprender más sobre este tema?

- Incia con [Altair Customizing Visualizations documentation](https://altair-viz.github.io/user_guide/customization.html).
- Para una discusión complemente acerca de los mapeos de escala, mira ["Introducing d3-scale"](https://medium.com/@mbostock/introducing-d3-scale-61980c51545f).
- Para una exploración más profunda de todas las formas en que los ejes y leyendas pueden ser estilizados por la biblioteca Vega (que alimenta a Altair y Vega-Lite), mira ["A Guide to Guides: Axes & Legends in Vega"](https://beta.observablehq.com/@jheer/a-guide-to-guides-axes-legends-in-vega).
- Para una historia fascinante del conjunto de datos de los antibióticos, mira [Wainer &amp; Lysen's "That's Funny..."](https://www.americanscientist.org/article/thats-funny) en la revisata _American Scientist_.