# "Entendendo o Plotly Figure Object"
> "O que está por trás dos gráficos incríveis do pacote Plotly?"

- toc: true
- branch: master
- badges: false
- comments: true
- author: Augusto dos Santos Pereira
- categories: [Plotly, Gráficos, Python]

In [24]:
# hide_input
# This cell is required for the export to HTML to work.
import plotly.io as pio
#pio.renderers.default = 'plotly_mimetype+notebook'
pio.renderers.default = 'colab'
# Default is plotly_mimetype+notebook, but jekyll fails to parse plotly_mimetype.
#pio.renderers.default = 'notebook_connected'
# Uncomment below to avoid using a CDN for plotly.js
# pio.renderers.default = 'notebook'

# Inject the missing require.js dependency.
from IPython.display import display, HTML
#js = '<script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" integrity="sha512-c3Nl8+7g4LMSTdrm621y7kf9v3SDPnhxLNhcjFJbKECVnmZHTdo+IRO05sNLTH/D3vA6u1X32ehoLC7WFVdheg==" crossorigin="anonymous"></script>'
#display(HTML(js))

## A importância dos Objetos nos Pacotes do Ecossistema PythonData

Em Python, a programação orientada a objeto é a tônica. Assim, os diversos pacotes do ecossistema de tecnologias para dados apresentam objetos a partir dos quais orbitam todas as suas funcionalidades. No pacote **Numpy** o principal objeto é o Array. enquanto **Pandas* tem o DataFrame, por sua vez **Pytorch** conta com o Tensor e **Scikit-Learn** traz os seus estimadores. Por isso, dominar essas ferramentas significa conhecer bem esses tipos de objetos, com sua estrutura, métodos, atributos e lógicas para otimização de uso.

No caso do pacote **Plotly**, voltado para produção de gráficos, não é diferente. Por essa razão, adiante vou apresentar uma breve discussão sobre o que é o **Plotly Figure Object** e como ele funciona, para que possamos ser mais efetivos na elaboração dos mais diversos produtos analíticos - gráficos, mapas e diagramas.

## Como Plotly Renderiza Gráficos?

Para podermos tratar do que é um Plotly Figure Object, é importante entendermos primeiramente como a biblioteca renderiza seus belos produtos gráficos. Nesse sentido, precisamos reconhecer que a versao Plotly em linguagem Python gera instruções para produção de gráficos, mas não é ela que os renderiza. Por se tratarem de gráficos interativos, os desenvolvedores optaram por fazer esse tipo de renderização em _**JavaScript**_, linguagem mais popular para desenvolvimento _web_.

Para poder gerar orientações em Python que pudessem servir para renderização de gráficos em Plotly JavaScript, a Python Plotly deve gerar informações em formato **JSON** - JavaScript Object Notation -, uma notação bastante popular no desenvolvimento web por conta de sua capacidade de otimização de transferência de dados em formatos de árvores.

Vejamos como essa ideia de árvores ajuda a motarmos um gráfico com elevado nível de abstração, ou seja, sem entrar em diversos detalhes que precisam ser considerados pelo renderizador.

* **Dados**
    * x
        * \[-5,-4,-3,-2,-1,0,1,2,3,4,5\]
    * y
        * \[25, 16,  9,  4,  1,  0,  1,  4,  9, 16, 25\]
    * orientação
        * 'vertical'
    * tipo
        * 'pontos dispersos'
    * modo
        * 'linhas'
    * linha
        * cor
            * azul
        * traço
            sólido
        
* **Layout**
    * altura
        * 300 pixels
    * largura
        * 1000 pixels
        
Por essa lógica de passarmos um conjunto de instruções em árvore para renderização de um gráfico, poderíamos pensar em algo assim como no exemplo acima. Poderíamos ter duas principais raízes, dados e layout. Em dados nós fazemos o mapeamento dos dados numéricos a suas respectivas representações pictóricas. Assim, os valores de -5 a 5 podem ser associados ao eixo x, enquanto os seus quadrados podem ser associados ao eixo y, mantendo uma representação vertical, em que o eixo x é o horizonta e o y, vertical. Esses valores podem ser representados por pontos dispersos - scatter -, ligados por linhas. A linha pode ter cor azul e o traço sólido.

Além da representação dos próprios dados e suas especificações, também poderíamos gerar comandos para a o layout de maneira geral, naquilo que independende dos dados (altura do gráfico, largura, margens, cor de fundo, marcadores nos eixos e suas fontes etc. No nosso exemplo, o Layout conta com altura de 300 pixels e largura de 1000 pixels. 

Bastante simples, não? Agora vejamos como o Plotly gera um gráfico como esses e como ele configura esse conjunto de instruções:

In [25]:
import plotly.express as px
import numpy as np

nums = np.array(range(-5,6))
quadrados = nums ** 2

fig = px.line(x=nums, y=quadrados, height=300, width=1000)
fig.show()

Acima, o processo é bastante simples, importammos Express, a API de alto nível de abstração do Plotly, criamos um array de números inteiros entre -5 e 5, nums, e calculamos seus quadrados. Em seguida, com a função line, para fazer um gráfico de linha, associamos os números ao x, os quadrados ao y, e especificamos a altura e a largura do gráfico em pixels. Por fim, usamos o método show na figura que geramos e que foi atribuída à variável fig. Voilà!

## O Plotly Figure Object

Já vimos anteriormente que Plotly Python usa essas funções para gerar instruções em JSON para que sejam passadas a Plotly JavaScript, que renderiza os gráficos. Assim, vejamos agora como são essas instruções.

In [26]:
print(fig)

Figure({
    'data': [{'hovertemplate': 'x=%{x}<br>y=%{y}<extra></extra>',
              'legendgroup': '',
              'line': {'color': '#636efa', 'dash': 'solid'},
              'mode': 'lines',
              'name': '',
              'orientation': 'v',
              'showlegend': False,
              'type': 'scatter',
              'x': array([-5, -4, -3, -2, -1,  0,  1,  2,  3,  4,  5]),
              'xaxis': 'x',
              'y': array([25, 16,  9,  4,  1,  0,  1,  4,  9, 16, 25]),
              'yaxis': 'y'}],
    'layout': {'height': 300,
               'legend': {'tracegroupgap': 0},
               'margin': {'t': 60},
               'template': '...',
               'width': 1000,
               'xaxis': {'anchor': 'y', 'domain': [0.0, 1.0], 'title': {'text': 'x'}},
               'yaxis': {'anchor': 'x', 'domain': [0.0, 1.0], 'title': {'text': 'y'}}}
})


Isso acima, meus caros, é o Plotly Figure Object, ou seja, é esse conjunto de elementos e atributos em forma de árvore (um mero dicionário em Python, ou JSON em JavaScript) que instruem a renderização dos gráficos. Vemos que a raiz é constituída pelo por data e layout, como apresentado no exemplo com tópicos. Observe que os galhos são chaves, que indicam elementos sobre os quais se quer especificar um determinado atributo, com valores designados nas folhas, ou, nos mais externos valores desse grande objeto que mais parece um dicionário Python.

De fato, a estrutura é um pouco mais complexa do que o nosso exemplo anterior. Em parte, compreender os principais caminhos dessa árvore corresponde justamente àquilo que precisamos para elaborar figuras com maior nível de personalização.

Então, voltemos duas casas para entender essa estrutura. Para tanto vamos elaborar um gráfico sem qualquer dado e ver do que se trata

In [27]:
fig2 = px.line()
fig2

In [28]:
print(fig2)

Figure({
    'data': [],
    'layout': {'legend': {'tracegroupgap': 0},
               'margin': {'t': 60},
               'template': '...',
               'xaxis': {'anchor': 'y', 'domain': [0.0, 1.0]},
               'yaxis': {'anchor': 'x', 'domain': [0.0, 1.0]}}
})


Notamos acima que temos algo muito mais simples. Trata-se de um gráfico vazio cujo Figure Object não apresenta qualquer valor associado à raiz data. Em layout poucas especificações são dadas. O eixo x é ancorado no eixo y, o eixo y é ancorado no eixo x e ambos tomam 100% da área plotada, de 0 a 1. Há uma margem no topo, de 60 pixels (se fosse na parte inferior seria b, na esquerda seria l, na direita seria especificado o elemento t). O intervalo entre grupos na legenda é de zero, mas aqui também não muda nada, afinal não há legenda!

O importante é notar que temos um elemento/chave/galho chamado template, cujo atributo/valor/folha está destacado por reticências, indicando que é um texto muito grande para ser mostrado. É nesse lugar que encontramos diversos elementos e atributos que não escolhemos, mas que estão renderizados na figura acima (cor cinza do fundo, posição dos marcadores dos eixos, fonte dos marcadores e cor das linhas de grade). Assim, o template contém os padrões que devem ser utilizados para aqueles elementos que não forem explicitamente indicados por nós nas funções de geração de Figure Objects.

Agora que vimos um objeto sem dados, fica um pouco mais fácil entender o que acontece no objeto anterior. Abaixo vamos ver cada um dos elementos da raiz data da primeira figura, com seus atributos:

{'hovertemplate': 'Números de -5 a 5=%{x}\<br>Quadrados=%{y}\<extra>\</extra>', **`formato do caixa que aparece no cursor`** <br>
 'legendgroup': '', **`Nenhum grupo de legenda indicado`** <br>
 'line': {'color': '#636efa', 'dash': 'solid'}, **`linha de cor azul e com traço sólido`** <br>
 'mode': 'lines', **`gráfico em modo linha`** <br>
 'name': '', `**gráfico sem título**` <br>
 'orientation': 'v', **`orientação vertical`** <br>
 'showlegend': False, **`legenda desativada`** <br>
 'type': 'scatter', **`gráfico de tipo pontos esparsos, ou scatter plot`** <br>
 'x': array(\[-5, -4, -3, -2, -1,  0,  1,  2,  3,  4,  5\]), **`dados associados ao eixo x`** <br>
 'xaxis': 'x',**`nome do eixo x`** <br>
 'y': array(\[25, 16,  9,  4,  1,  0,  1,  4,  9, 16, 25\]), **`dados associados ao eixo y`** <br>
 'yaxis': 'y'} **`nome do eixo y`** <br>


{% include alert.html text="É comum que a mesma coisa tenha diferentes nomes em diferentes contexto. Quando pensamos em estrutura de árvore, um determinado nó pode ser um galho. Quando pensamos em dicionários, o nome adequado é chave. Como estamos falando justamente da interface entre JavaScript, Python e plotagem de gráficos, por vezes esses termos são utilizados de maneira intercambiável" %}