# Altair Overview

Notebook focado na utilização do Altair e aprender principais características da biblioteca para sua utilização na disciplina de Visualização de Dados da graduação de Sistemas de Informação na Universidade Federal Fluminense.

Esse overview se baseará na seção _Basic Statistical Visualization_ da documentação de [altair](https://altair-viz.github.io/getting_started/starting.html). 

In [1]:
import pandas as pd
data = pd.DataFrame({'a': list('CCCDDDEEE'),
                     'b': [2, 7, 4, 1, 2, 6, 8, 4, 7]})


Usando principalmente dataframes como base para fazer as visualizações.

In [2]:
import altair as alt
chart = alt.Chart(data)

Mostrando o dado como simplesmente um ponto. Será reinderizado um ponto por cada linha, que será sobreposto pois não instruímos relações de posições.

In [3]:
alt.Chart(data).mark_point()

Para separar visualmente os pontos, podemos mapear vários canais de codificação, ou canais, para colunas no conjunto de dados. Por exemplo, poderíamos codificar a variável _a_ dos dados com o eixo x, que representa a posição dos pontos no eixo x. Isso pode ser feito diretamente através do método Chart.encode():

In [4]:
alt.Chart(data).mark_point().encode(
    x='a',
)

O método encode() cria um mapeamento de valor-chave entre canais de codificação (como x, y, cor, forma, tamanho, etc.) para colunas no conjunto de dados, acessado pelo nome da coluna.

Para dataframes pandas, o Altair determina automaticamente o tipo de dados apropriado para a coluna mapeada, que neste caso é um valor nominal ou um categórico não ordenado.

Embora já tenhamos separado os dados por um atributo, ainda temos vários pontos sobrepostos em cada categoria. Vamos separá-los ainda mais adicionando um canal de codificação y, mapeado para a coluna "b":

In [5]:
alt.Chart(data).mark_point().encode(
    x='a',
    y='b'
)

O tipo de dados na coluna “b” é novamente inferido automaticamente pelo Altair, e desta vez é tratado como um tipo quantitativo (ou seja, com valor real). Além disso, vemos que as linhas de grade e os títulos dos eixos apropriados também são adicionados automaticamente.

## Transformação de Dados: Agregação

Para permitir mais flexibilidade na forma como os dados são visualizados, o Altair possui uma sintaxe integrada para agregação de dados. Por exemplo, podemos calcular a média de todos os valores especificando esta agregação no identificador da coluna:

In [6]:
alt.Chart(data).mark_point().encode(
    x='a',
    y='average(b)'
)

Agora, dentro de cada categoria do eixo x, vemos um único ponto refletindo a média dos valores dentro dessa categoria.

Normalmente, os valores agregados não são representados por marcações de pontos, mas por marcações de barras. Podemos fazer isso substituindo mark_point() por mark_bar():

In [7]:
alt.Chart(data).mark_bar().encode(
    x='a',
    y='average(b)'
)

Como o recurso categórico é mapeado no eixo x, o resultado é um gráfico de barras verticais. Para obter um gráfico de barras horizontais, tudo o que precisamos é trocar as palavras-chave x e y:

In [8]:
alt.Chart(data).mark_bar().encode(
    y='a',
    x='average(b)'
)

## À parte: examinando a saída JSON
Lembre-se de que o objetivo principal do Altair é converter as especificações do gráfico em uma string JSON que esteja em conformidade com o esquema Vega-Lite. É instrutivo aqui usar o método to_json() para inspecionar a especificação JSON que Altair está exportando e enviando como JSON para Vega-Lite:

In [9]:
chart = alt.Chart(data).mark_bar().encode(
    x='a',
    y='average(b)',
)
print(chart.to_json())

{
  "$schema": "https://vega.github.io/schema/vega-lite/v5.14.1.json",
  "config": {
    "view": {
      "continuousHeight": 300,
      "continuousWidth": 300
    }
  },
  "data": {
    "name": "data-347f1284ea3247c0f55cb966abbdd2d8"
  },
  "datasets": {
    "data-347f1284ea3247c0f55cb966abbdd2d8": [
      {
        "a": "C",
        "b": 2
      },
      {
        "a": "C",
        "b": 7
      },
      {
        "a": "C",
        "b": 4
      },
      {
        "a": "D",
        "b": 1
      },
      {
        "a": "D",
        "b": 2
      },
      {
        "a": "D",
        "b": 6
      },
      {
        "a": "E",
        "b": 8
      },
      {
        "a": "E",
        "b": 4
      },
      {
        "a": "E",
        "b": 7
      }
    ]
  },
  "encoding": {
    "x": {
      "field": "a",
      "type": "nominal"
    },
    "y": {
      "aggregate": "average",
      "field": "b",
      "type": "quantitative"
    }
  },
  "mark": {
    "type": "bar"
  }
}


Observe aqui que encode(x='a') foi expandido para uma estrutura JSON com um nome de campo e um tipo para os dados. O encode(y='b') foi expandido de forma semelhante e inclui um campo agregado.

A sintaxe abreviada completa do Altair também inclui uma maneira de especificar o tipo da coluna:

In [10]:
y = alt.Y('average(b):Q')
print(y.to_json())

{
  "aggregate": "average",
  "field": "b",
  "type": "quantitative"
}


Da mesma forma podemos escrever:

In [11]:
y = alt.Y(field='b', type='quantitative', aggregate='average')
print(y.to_json())

{
  "aggregate": "average",
  "field": "b",
  "type": "quantitative"
}


Este meio mais detalhado de especificar canais pode ser usado diretamente nas especificações do gráfico Altair, um fato que se torna útil ao usar algumas das configurações de campo mais avançadas:

In [12]:
alt.Chart(data).mark_bar().encode(
    alt.Y('a', type='nominal'),
    alt.X('b', type='quantitative', aggregate='average')
)

## Personalizando sua visualização
Por padrão, o Altair via Vega-Lite faz algumas escolhas sobre as propriedades padrão da visualização. Altair também fornece uma API para personalizar a aparência da visualização. Por exemplo, podemos especificar os títulos dos eixos usando o método title() das classes de canal, e podemos especificar a cor da marca definindo a palavra-chave color do método Chart.mark_* para qualquer string de cor HTML válida:

In [13]:
alt.Chart(data).mark_bar(color='firebrick').encode(
    alt.Y('a').title('category'),
    alt.X('average(b)').title('avg(b) by category')
)

## Publicando sua visualização
Depois de visualizar seus dados, talvez você queira publicá-los em algum lugar da web. Isso pode ser feito diretamente usando o pacote Javascript Vega-Embed. Um exemplo simples de documento HTML independente pode ser gerado para qualquer gráfico usando o método Chart.save():

In [14]:
chart = alt.Chart(data).mark_bar().encode(
    x='a',
    y='average(b)',
)
#chart.save('chart.html')

O método save() fornece uma maneira conveniente de salvar a saída HTML em um arquivo. Para obter mais informações sobre a incorporação do Altair/Vega-Lite, consulte a documentação do projeto Vega-Embed.

---

A documentação termina assim.

--- 
Para continuação dos exemplos e trabalhos, sigo fazendo detalhes dos notebooks do repositório no  [Github](https://github.com/altair-viz/altair_notebooks/tree/master/notebooks).

Para fazer os exemplos precisa **instalar o módulos dos datasets da vega**.