# "Conhecendo a Estrutura do Plotly (Parte 2)"
> "Rumo ao domínio dessa ferramenta arrojada!"

- toc: true
- branch: master
- badges: false
- comments: true
- author: Augusto dos Santos Pereira
- categories: [Plotly, Gráficos, Python]

In [1]:
# hide_input
# This cell is required for the export to HTML to work.
import plotly.io as pio
#pio.renderers.default = 'plotly_mimetype+notebook'
pio.renderers.default = 'colab'
# Default is plotly_mimetype+notebook, but jekyll fails to parse plotly_mimetype.
#pio.renderers.default = 'notebook_connected'
# Uncomment below to avoid using a CDN for plotly.js
# pio.renderers.default = 'notebook'

# Inject the missing require.js dependency.
from IPython.display import display, HTML
#js = '<script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" integrity="sha512-c3Nl8+7g4LMSTdrm621y7kf9v3SDPnhxLNhcjFJbKECVnmZHTdo+IRO05sNLTH/D3vA6u1X32ehoLC7WFVdheg==" crossorigin="anonymous"></script>'
#display(HTML(js))

## Dando Continuidade

Há alguns dias, publiquei uma [postagem](https://augustogeog.github.io/augustogeog/plotly/gr%C3%A1ficos/python/2021/05/31/introdu%C3%A7%C3%A3o-plotly.html) em  que defendi que, em meio a tantas ferramentas disponíveis no ecossistema Python para dados, é importante que os profissionais nas carreiras intensivas em tecnologias de dados escolham aqueles pacotes que pretendem dominar, conhecendo a fundo sua lógica de funcionamento, principais objetos (classes, funções etc.) e estrutura. Por isso, apresentei três dos sete subpacotes do **[Plotly](https://plotly.com/python/)**, aquele que escolhi como meu principal instrumento para elaboração de produtos analíticos diversos - gráficos, cartogramas e diagramas -, por conta de sua versatilidade, rápida curva de aprendizado, seus resultados belos e interativos, além de sua fácil integração com outras bibliotecas importantes do ecossistema PyData.

Na primeira postagem tratei dos supacotes **Plotly Data** (carregamento de datasets-exemplos como Pandas DataFrame), **Plotly Express** (interface de alto nível de abstração que permite fazer gráficos arrojados com uma única função) e **Plotly Colors** (conjunto de funções que geram diferentes tipos de paletas de cores cíclicas, divergentes, sequenciais e qualitativas). Assim, nesta postagem, vamos avançar sobre outros dois dos setes subpacotes principais: **Graph Objects** e **Subplots**.

## Graph Objects

O subpacote Graph Objects é aquele que contém as classes e funções para a elaboração dos produtos analíticos. Mas isso não tem no Plotly Express, Augusto? Sim! No entanto, o Express é uma interface mais simplificada que justamente usa os Graph Objects para gerar os gráficos. Com isso, ganha-se em intuitividade da programação, mas perde-se em capacidade de customização. Nesse sentido, se quisermos fazer um gráfico, mapa ou diagrama mais customizado devemos descer mais no nível de abstração e utilizar Graph Objects. Por vezes, também podemos iniciar um gráfico na API mais alta e utilizar as ferramentas disponíveis nos mais baixos níveis para procedimentos de personalização.

Tanto as classes em Graph Objects como as funções em Plotly Express têm o papel de gerar **Figure Objects**, estruturas em árvore, como um **dicionário** Python, mais precisamente um **[JSON](https://pt.wikipedia.org/wiki/JSON)**, que apresentam especificações sobre o gráfico a ser renderizado.

> Tip: Em [post anterior](https://augustogeog.github.io/augustogeog/plotly/gr%C3%A1ficos/python/2021/06/04/figura-plotly.html), há uma discussão mais ampla sobre o Plotly Figure Object e sua estrutura em árvore.

No entanto, embora as funções de Plotly Express sejam bastante robustas e entreguem produtos analíticos muito interessantes, por vezes precisamos descer mais no nível de abstração, para podermos criar gráficos ainda mais personalizados.

Primeiramente, façamos uma breve comparação dos procedimentos para criação de um gráfico com Plotly Express e com Graph Objects.

> Important: A estrutura do pacote e os exemplos de código abaixo se referem à versão 4.14.3 do Plotly.

In [2]:
import pandas as pd # importando pacote pandas para geração de DataFrame para dados tabulares
import plotly.express as px # importando subpacote Plotly Express
import plotly.graph_objects as go

df = pd.DataFrame({'A':[1,2,3],'B':[1,4,9], 'C':[1,8,27], 'D':[1, 16, 81]}) # instanciando um DataFrame
df # visualizando o DataFrame df

Unnamed: 0,A,B,C,D
0,1,1,1,1
1,2,4,8,16
2,3,9,27,81


Acima importamos as bibliotecas necessárias e construímos um Pandas DataFrame com alguns dados. Adiante vamos fazer um gráfico de linha com os dados das colunas A e B, com a função line do Plotly Express.

In [3]:
fig_px = px.line( # função para fazer gráfico de linha com Plotly Express
    data_frame=df # indicando df como o DataFrame a ser plotado
    , x='A' # indicando que os dados da coluna A devem ser referenciados no eixo x
    , y='B' # indicando que os dados da coluna B devem ser referenciados no eixo y
    , height=300 # estabelecendo 300 pixels de altura
    , title='Exemplo') # criando o título do gráfico

fig_px.show() # renderizando o gráfico

A figura foi renderizada assim, pois Plotly Express criou um Figure Object contendo duas raízes, data e layout, conforme especificações apresentadas abaixo.

In [4]:
print(fig_px) # apresentando a estrutura do Figure Object, conjunto de instruções para renderização do gráfico

Figure({
    'data': [{'hovertemplate': 'A=%{x}<br>B=%{y}<extra></extra>',
              'legendgroup': '',
              'line': {'color': '#636efa', 'dash': 'solid'},
              'mode': 'lines',
              'name': '',
              'orientation': 'v',
              'showlegend': False,
              'type': 'scatter',
              'x': array([1, 2, 3], dtype=int64),
              'xaxis': 'x',
              'y': array([1, 4, 9], dtype=int64),
              'yaxis': 'y'}],
    'layout': {'height': 300,
               'legend': {'tracegroupgap': 0},
               'template': '...',
               'title': {'text': 'Exemplo'},
               'xaxis': {'anchor': 'y', 'domain': [0.0, 1.0], 'title': {'text': 'A'}},
               'yaxis': {'anchor': 'x', 'domain': [0.0, 1.0], 'title': {'text': 'B'}}}
})


Para fazermos o mesmo gráfico com Graph Object, temos que ser um pouco mais explícitos, afinal mais baixo nível de abstração significa que estamos fazendo certos procedimentos com maior nível de autonomia.

In [5]:
fig_go = go.Figure( # chamando o construtor da classe Figure
    data=go.Scatter(x=df['A'],y=df['B'], mode='lines'), # indicando o trace que deve estar na chave data do objeto Figure
    layout=go.Layout(height=300, title='Exemplo')) # indicando especificações do layout do objeto Figure

fig_go.show() # renderizando fig_go

Notemos que precisamos utilizar a classe Figure para montar estanciar o Figure Object, apresentando os argumentos data e layout, que são justamente as raizes da estrutura do Figure Object, conforme vimos anteriormente. Em data, inserimos um construtor, Scatter, que nos auxilia a passar a adequada estrutura do trace. Trace é o mapeamento dos dados tabulares a suas respectivas representações gráficas. Aqui vemos que um gráfico de linhas, na realidade é um gráfico de pontos dispersos, scatter plot, em modo linha, ou seja, com uma linha ligando esses pontos. 
Outra diferença importante em relação à função do Plotly Express, é que precisamos apresentar explicitamente a coluna de dados, com sintaxe de seleção. Não pudemos fazer como antes, em que indicamos qual era o DataFrame, para depois somente associar o nome das colunas aos atributos gráficos - variação no eixo x e no eixo y, no caso.
Em seguida, no argumento layout, inserimos um construtor de layout, em que informamos a altura do gráfico e seu título.

A princípio, a segunda opção parece muito mais verborrágica. Ela realmente não é recomendada para esse tipo de gráfico mais simples. Nós a devemos utilizar, quando queremos gerar gráficos mais complexos, que não podem ser feitos com Plotly Express. Vejamos adiante um exemplo que mistura diferentes tipos de traces.

In [6]:
fig_go = go.Figure( # chamando o construtor da classe Figure
    data=[ # indicando diversos traces em uma lista como valor da chave data no objeto Figure
        go.Scatter(x=df['A'],y=df['B'], mode='lines'), 
        go.Scatter(x=df['A'],y=df['C'], mode="markers"),
        go.Bar(x=df['A'],y=df['D'])], 
    layout=go.Layout(height=400, title='Exemplo')) # indicando especificações do layout do objeto Figure

fig_go.show() # renderizando fig_go

Nota-se, portanto, que é com Graph Objects que podemos ter maior controle sobre os gráficos. Esse controle, no entanto, é mais complexo e explícito, exigindo que tenhamos maior conhecimento da estrutura do Figure Object (data, layout e, por vezes, frames) e certamente mais consultas à documentação.

De maneira geral, é importante guardarmos em mente que Graph Objects no permite personalização de todos os elementos do plot. Esses elementos, portanto, terão seus respectivos construtores de classes. Assim, não contamos somente com construtores para Figure Object e traces, mas tambem para anotações, widgets, legenda, eixos etc.

## Subplots

Uma estratégia importante de comunicação visual é a utilização de subplots, de quadros com diversos gráficos arranjados de maneira a transmitir mais adequadamente as nossas análises. Plotly tem uma solução interessante para isso, o subpacote Subplots. A principal ferramenta nesse subpacote é a função make_subplots. Vamos a ela.

In [7]:
from plotly.subplots import make_subplots # importando a função make_subplots
subp = make_subplots(rows=1,cols=3, shared_yaxes=True) # criando uma área para subplots, sem traces associados a data, e com três colunas e eixo y comum

In [8]:
print(subp)

Figure({
    'data': [],
    'layout': {'template': '...',
               'xaxis': {'anchor': 'y', 'domain': [0.0, 0.2888888888888889]},
               'xaxis2': {'anchor': 'y2', 'domain': [0.35555555555555557, 0.6444444444444445]},
               'xaxis3': {'anchor': 'y3', 'domain': [0.7111111111111111, 1.0]},
               'yaxis': {'anchor': 'x', 'domain': [0.0, 1.0]},
               'yaxis2': {'anchor': 'x2', 'domain': [0.0, 1.0], 'matches': 'y', 'showticklabels': False},
               'yaxis3': {'anchor': 'x3', 'domain': [0.0, 1.0], 'matches': 'y', 'showticklabels': False}}
})


Simplesmente o que ocorreu aqui é que uma Plotly Figure foi criada, sem qualquer trace associada à chave data, mas com espaço para três pares de eixos, xaxis e yaxis, xaxis2 e yaxis2, bem como xaxis3 e yaxis3. Cada um desses pares de eixos tem o dommínio sobre parte da distribuição horizontal da figura. O primeiro par vai de 0 a 0.28, ou seja desde a coordena horizontal 0, canto inferior esquerdo, até 28% da extensão para direita. Os demais têm domínio, respectivamente, sobre as coordenadas 0.35 a 0.64 e 0.71 a 1. 

É importante notar que os eixos yaxis2 e yaxis3 estão ajustados, matche, ao eixo y, pois escolhemos shared_yaxes como True, ou seja, que os plots compartilhassem um eixo vertical comum.

O que precisamos, agora, é inserir traces, mapeamentos de dados tabulares e atributos gráficos, na chave data. Vamos utilizar os traces anteriormente criados como argumento do método add_trace. Para Plotly saiba a que par de eixos inserir, vamos utilizar os argumentos row e col.

In [9]:
subp.add_trace(
    go.Scatter(x=df['A'],y=df['B'], mode='lines'),
    row=1,
    col=1
)

In [10]:
subp.add_trace(
    go.Scatter(x=df['A'],y=df['C'], mode="markers"),
    row=1,
    col=2
)         

In [11]:
subp.add_trace(
    go.Bar(x=df['A'],y=df['D']),
    row=1,
    col=3
) 

## Mais por Vir

Vimos até aqui uma série de conceitos interessantes sobre a estrutura do Pacote Plotly. Notamos que o subpacote Graph Objects tem mais opções para que possamos criar gráficos bastante customizados. Vimos, ainda, que o subpacote Subplots apresenta uma função bem importante, make_subplots, para que possamos criar gráficos compostos por diversos eixos.

Ainda há mais por vir. Precisamos tratar do Subpacotes IO e Figure Factories. Mas esses aí ficam para próxima!