### 2.2.3. Tamanho

O canal de codificação `size` determina o tamanho ou a escala de uma marca. O significado desse canal pode variar dependendo do tipo de marca utilizada. Para marcas do tipo `point`, o canal `size` é associado à área em pixels do símbolo de plotagem, de forma que o diâmetro do ponto seja proporcional à raiz quadrada do valor atribuído ao tamanho.

Vamos melhorar nosso gráfico de dispersão utilizando o canal `size` para codificar a população (`pop`). Desta forma, o gráfico passa a incluir uma legenda que facilita a interpretação dos valores representados pelo tamanho.

In [None]:
alt.Chart(data2000).mark_point().encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q')
)

Em certos casos, o tamanho padrão não nos agrada ou não atende o esperado, por isso é necessário fazer algumas alterações. Para ajustar esse intervalo, podemos configurar o parâmetro `range` do atributo `scale` como um array que define os tamanhos mínimo e máximo desejados. No exemplo abaixo, ajustamos a codificação de tamanho para variar de 0 pixels (para valores iguais a zero) até 1.000 pixels (para o valor máximo no domínio da escala):

In [None]:
alt.Chart(data2000).mark_point().encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q', scale=alt.Scale(range=[0,1000]))
)

### 2.2.4 Cor e Opacidade

O canal de codificação de cores especifica a cor atribuída a uma marca. O estilo de codificação varia significativamente conforme o tipo de dado: para dados nominais, é utilizado um esquema de cores qualitativo multicolorido, enquanto para dados ordinais e quantitativos, são aplicados gradientes de cores ordenados.

Abaixo, utilizamos o canal `color` para codificar o campo `cluster` com um tipo de dado nominal (`N`), atribuindo uma cor distinta a cada valor de cluster. Com isso, já podemos ter uma noção do que o campo `cluster`representa.

In [None]:
alt.Chart(data2000).mark_point().encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q', scale=alt.Scale(range=[0,1000])),
    alt.Color('cluster:N')
)

Caso deseje formas com as cores preenchidas, podemos passar um parâmetro `filled=True` para o método `mark_point`. Fazendo isso, a forma escolhida passa a ficar totalmente preenchida com a cor, e não apenas a borda:

In [None]:
alt.Chart(data2000).mark_point(filled=True).encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q', scale=alt.Scale(range=[0,1000])),
    alt.Color('cluster:N')
)

Por padrão, o Altair usa um pouco de transparência para solucionar sobreposições de dados no gráfico. Como solução, podemos mudar a opacidade ajustando um valor no método `mark_*` ou usando um canal de codificação só para isso.

Aqui, mostramos como atribuir um valor fixo a um canal de codificação, em vez de usar um campo de dados:

In [None]:
alt.Chart(data2000).mark_point(filled=True).encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q', scale=alt.Scale(range=[0,1000])),
    alt.Color('cluster:N'),
    alt.OpacityValue(0.5)
)

### Forma

O canal de codificação `shape` define a forma geométrica das marcas de `point`. Diferente dos outros canais que vimos, o canal `shape` não pode ser usado com outros tipos de marca. Ele deve ser utilizado apenas com dados nominais, pois não é possível fazer comparações de ordem ou magnitude de forma perceptível.

Vamos aplicar a codificação do campo `cluster` utilizando os canais `shape` e `color`. Quando usamos múltiplos canais para o mesmo conjunto de dados, isso é chamado de *codificação redundante*. O gráfico gerado junta as informações de cor e forma em uma única legenda de símbolos:

In [None]:
alt.Chart(data2000).mark_point(filled=True).encode(
    alt.X('fertility:Q'),
    alt.Y('life_expect:Q'),
    alt.Size('pop:Q', scale=alt.Scale(range=[0,1000])),
    alt.Color('cluster:N'),
    alt.OpacityValue(0.5),
    alt.Shape('cluster:N')
)