<img src="../tema_google.png">

# Biblioteca Plotly
___

<p style="text-align: right">
    <strong>Ministrante:</strong> Miguel Marques Ferreira
    <br>
    <strong>E-mail:</strong> miguel.marques@cear.ufpb.br
    <br>
    <br>
    <strong>Data:</strong> --\11\2021
    </p>

## O que é e quais características?

1. plotly.py é open-source;
   1. https://github.com/plotly
2. Construida em cima de uma biblioteca plotly em JavaScrypt (plotly.js);
3. Integrada com o utilitário de exportaçao de imagens ORCA (atualização "recente");
4. Suporta construção de inúmeros tipos de graficos. Ex.: científico, estatístico, financeiro, gráficos em 2D e 3D, mapas, etc;
5. Aplicações fora e dentro da web.
6. Permite ao usario criar visualizações com um visual atrativo e interativos!

### Exemplos

<img src="./images/ex1_grafico.png">

<img src="./images/ex2_graficoDeBarras.png">

<img src="./images/ex3_graficoSubs.png">

<img src="./images/ex4_mapaPB.png">

## Vamos criar nossa primeira figura!

#### Antes, é preciso configurarmos nossas máquinas de forma que apresentem as mesmas versões de bibliotecas Plotly instaladas em um ambiente virtual conda. **Link da aula:** [link da aula sobre ambientes virtuais](https://github.com/PETEletricaUFPB/intro_a_manipulacao_de_dados_com_python/blob/main/notebooks/Aula%205%20-%20Ambientes%20Virtuais%20e%20Jupyter%20Notebook.ipynb)

**Caso seu ambiente virtual não apareca no Jupyter Notebook:** `conda install -c conda-forge --name cursoPETvisualizacao ipykernel -y`



In [1]:
import plotly.graph_objects as go

In [2]:
fig = go.Figure()

### Como exibir Figuras 

1. **Renderização (scrypt/note):**
   1. Os gráficos criados com [Orca](https://plotly.com/python/orca-management/) são imagens estáticas.
      1. Uma vez que um gráfico estático foi criado, é possível exporta-la utilizando o comando `fig.write_image('nome_da_imagem.svg')`
   2. Os gráficos interativos são feitos a partir da biblioteca plotly.js
   
2. **Dash (web):**
   1. Dash é um framework que foi desenvolvido pra possibilar as aplicações da biblioteca plotly.py em aplicações web.
   2. _**O uso do dash não será discutido aqui/hoje.**_
   
3. **Figurewidget:**
   1. (ipywidgets = controles interativos)


In [3]:
fig

### Renderização de imagens estáticas no scrypt/notebook

1. Para exibir uma figura em um script (.py) ou notebook (.ipynb), precisamos do framework `renderers` que permite essa tarefa ser executada;
2. É necessário definir a figura desejada a partir da função `Figure()` do módulo graph_objects
3. `fig.show()` ou apenas fig exibem a figura;
   
**Link de apoio:** https://plotly.com/python/renderers/

In [8]:
fig.show()

### Estrutura de uma Figura

Imaginando um objeto Figure como uma árvore, cada nó nessa árvore nos leva a um galho (parte superior) e, assim, cada galho é um atributo. Por outro lado, a árvore possúi raizes (parte inferior) que podemos considerar os atributos principais da árvore. Por fim, para as raizes, cada nó superíor funciona como subatributos de cada atributo principal da árvore.

Nesse caso, as 3 principais raizes de um objeto Figure são:
1. `data`
2. `layout`
3. `frames`

Vamos voltar ao objeto criado anteriormente...

In [6]:
aux = fig.to_dict() # conversão do objeto em um dicionário python
aux.keys() # retornando as chaves principais do dicionário

dict_keys(['data', 'layout'])

In [16]:
aux['data'].keys() # o objeto Figure é criado com valores defaults durante a renderização da figura. Não é o caso para chave data responsável pelos valores a serem plotados, então ela é uma chave que tem como valor uma lista nula

AttributeError: 'list' object has no attribute 'keys'

In [11]:
aux['layout'].keys()

dict_keys(['template'])

In [14]:
aux['layout']['template']['layout'].keys()

dict_keys(['autotypenumbers', 'colorway', 'font', 'hovermode', 'hoverlabel', 'paper_bgcolor', 'plot_bgcolor', 'polar', 'ternary', 'coloraxis', 'colorscale', 'xaxis', 'yaxis', 'scene', 'shapedefaults', 'annotationdefaults', 'geo', 'title', 'mapbox'])

In [11]:
print(type(fig))
print(fig)

<class 'plotly.graph_objs._figure.Figure'>
Figure({
    'data': [], 'layout': {'template': '...'}
})


In [12]:
fig.to_dict()

{'data': [],
 'layout': {'template': {'data': {'histogram2dcontour': [{'type': 'histogram2dcontour',
      'colorbar': {'outlinewidth': 0, 'ticks': ''},
      'colorscale': [[0.0, '#0d0887'],
       [0.1111111111111111, '#46039f'],
       [0.2222222222222222, '#7201a8'],
       [0.3333333333333333, '#9c179e'],
       [0.4444444444444444, '#bd3786'],
       [0.5555555555555556, '#d8576b'],
       [0.6666666666666666, '#ed7953'],
       [0.7777777777777778, '#fb9f3a'],
       [0.8888888888888888, '#fdca26'],
       [1.0, '#f0f921']]}],
    'choropleth': [{'type': 'choropleth',
      'colorbar': {'outlinewidth': 0, 'ticks': ''}}],
    'histogram2d': [{'type': 'histogram2d',
      'colorbar': {'outlinewidth': 0, 'ticks': ''},
      'colorscale': [[0.0, '#0d0887'],
       [0.1111111111111111, '#46039f'],
       [0.2222222222222222, '#7201a8'],
       [0.3333333333333333, '#9c179e'],
       [0.4444444444444444, '#bd3786'],
       [0.5555555555555556, '#d8576b'],
       [0.6666666666666666, '

**Exemplo de como podemos acessar elementos de um Figure e como a estrutura de uma Figure se equipara a um dicionário**

**Link de apoio:** https://plotly.com/python/axes/

In [18]:
fig.layout.xaxis.rangeslider.visible = True

In [19]:
fig

### Além do módulo `graph_objects`, pode ser usado a ferramenta `express`.

Incialmente, o módulo `express` é recomendado para inciar a utilização da ferramenta Plotly por ser de fácil utilização. Por trás dos panos, o que ocorre é que cada função desse módulo utiliza internamente e retorna um `plotly.graph_objects`.

Principais vantagens:
1. Qualquer função criada utilizando uma única função com Plotly Express pode ser criada com o Graph Objects, mas com 5x ou até 100x menos linhas de código;
2. Possui mais de 30 funções para criar diferentes tipos de figuras;
3. Quando não precisar criar figuras de forma rápida e simples, vale a pena utilizar o `módulo graph_objects`
   

**Link de apoio:** https://plotly.com/python/plotly-express/

In [21]:
import plotly.express as px

In [22]:
iris = px.data.iris() # pegando um dataset interno ao módulo

In [24]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


In [23]:
fig = px.scatter(iris, x="sepal_width", y="sepal_length", color="species")

In [25]:
fig #ou fig.show()

In [35]:
aux = fig.to_dict()
aux.keys()

dict_keys(['data', 'layout'])

In [43]:
len(aux['data']) # quantidade de traços na figura

3

In [44]:
aux['data'][0].items() # conteudo do primeiro traço

dict_items([('hovertemplate', 'species=setosa<br>sepal_width=%{x}<br>sepal_length=%{y}<extra></extra>'), ('legendgroup', 'setosa'), ('marker', {'color': '#636efa', 'symbol': 'circle'}), ('mode', 'markers'), ('name', 'setosa'), ('orientation', 'v'), ('showlegend', True), ('x', array([3.5, 3. , 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, 3.4, 3. ,
       3. , 4. , 4.4, 3.9, 3.5, 3.8, 3.8, 3.4, 3.7, 3.6, 3.3, 3.4, 3. ,
       3.4, 3.5, 3.4, 3.2, 3.1, 3.4, 4.1, 4.2, 3.1, 3.2, 3.5, 3.1, 3. ,
       3.4, 3.5, 2.3, 3.2, 3.5, 3.8, 3. , 3.8, 3.2, 3.7, 3.3])), ('xaxis', 'x'), ('y', array([5.1, 4.9, 4.7, 4.6, 5. , 5.4, 4.6, 5. , 4.4, 4.9, 5.4, 4.8, 4.8,
       4.3, 5.8, 5.7, 5.4, 5.1, 5.7, 5.1, 5.4, 5.1, 4.6, 5.1, 4.8, 5. ,
       5. , 5.2, 5.2, 4.7, 4.8, 5.4, 5.2, 5.5, 4.9, 5. , 5.5, 4.9, 4.4,
       5.1, 5. , 4.5, 4.4, 5. , 5.1, 4.8, 5.1, 4.6, 5.3, 5. ])), ('yaxis', 'y'), ('type', 'scatter')])

In [55]:
print(aux['layout'].keys())

dict_keys(['template', 'xaxis', 'yaxis', 'legend', 'margin'])


In [56]:
aux['layout']['xaxis'].items() # estilho aplicado ao primeiro traço

dict_items([('anchor', 'y'), ('domain', [0.0, 1.0]), ('title', {'text': 'sepal_width'})])

## Adicionando elementos no grafico

In [15]:
fig1 = go.Figure()

In [16]:
fig1 = px.scatter(iris, x="sepal_width", y="sepal_length", color="species")

In [21]:
fig1

Em `fig.add_trace()` está sendo adiconado ao grafico da célula acima uma reta com as coordenadas especificadas dentro de go.scatter
* `mode` define o tipo de estrutura a ser adicionada 
* Ainda é possivel determinar a cor desse novo objeto
* Em showlegend define-se se será ou não exibido uma legenda para o novo elemento!

In [22]:
fig.add_trace(
    go.Scatter(
        x=[2, 4],
        y=[4, 8],
        mode="lines",
        line=go.scatter.Line(color="gray"),
        showlegend=False)
)

## Criando gráficos a partir de arquivos

In [5]:
import pandas as pd

### Arquivo 1

In [6]:
df = pd.read_csv('./data/anual_sousa_geral.csv')

In [7]:
df.head()

Unnamed: 0,index,PRECTOT,QV2M,RH2M,PS,T2M,T2M_MIN,T2M_MAX,WS50M_MIN,WS10M_MIN,...,WS10M_MAX,WS50M,WS10M,T2M_MAX_MAXIMO,WS50M_MAX_MAXIMO,WS10M_MAX_MAXIMO,T2M_MIN_MINIMO,WS50M_MIN_MINIMO,WS10M_MIN_MINIMO,PRECTOT_SUM
0,1983,1.214611,0.012215,50.368129,97.456816,28.153267,21.362786,35.722888,4.505772,2.910715,...,6.615755,6.348154,4.696986,39.27,12.13,9.46,17.64,0.1,0.07,433.46
1,1984,2.405578,0.013062,58.233992,97.385483,27.096376,21.027319,34.050441,4.270111,2.770825,...,6.182936,5.994989,4.339975,39.23,12.3,9.59,15.7,0.35,0.17,879.9
2,1985,4.755883,0.014129,68.24613,97.445954,25.67825,20.550523,31.724801,3.848431,2.379439,...,5.628156,5.52759,3.897494,39.07,12.05,9.29,15.73,0.11,0.09,1711.48
3,1986,2.987752,0.013625,64.243201,97.490026,26.029608,20.387316,32.560132,4.107132,2.575924,...,6.036315,5.885216,4.191639,38.23,12.32,9.5,15.72,0.51,0.36,1082.35
4,1987,1.845871,0.012791,54.533294,97.453516,27.763701,21.29919,35.076351,4.423268,2.754072,...,6.354051,6.156872,4.48261,39.74,11.79,9.05,18.07,1.49,1.07,668.71


In [8]:
fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x = df['index'],
        y = df['PRECTOT'],
        mode='lines+markers'
    )
)

##### O arquivo .csv tem 21 colunas, vou ter que adicionar coluna por coluna a figura?

Desafio (5min) - Tente inserir todas as colunas com dados do meu DataFrame `df` de forma prática e rápida.

**Dica:** Como é uma atividade repetitiva e o eixo x é sempre a mesma coluna `index`, utilize o seu conhecimento em Python para simplificar o processo de inserção das colunas a figura.
**Dica:** Você consegue pegar todas as colunas do DataFrame fazendo df.columns, comando que irá te retornar um array com todos os títulos do DataFrame.

In [9]:
colunas = df.columns
colunas

Index(['index', 'PRECTOT', 'QV2M', 'RH2M', 'PS', 'T2M', 'T2M_MIN', 'T2M_MAX',
       'WS50M_MIN', 'WS10M_MIN', 'WS50M_MAX', 'WS10M_MAX', 'WS50M', 'WS10M',
       'T2M_MAX_MAXIMO', 'WS50M_MAX_MAXIMO', 'WS10M_MAX_MAXIMO',
       'T2M_MIN_MINIMO', 'WS50M_MIN_MINIMO', 'WS10M_MIN_MINIMO',
       'PRECTOT_SUM'],
      dtype='object')

In [10]:
fig = go.Figure()

In [11]:
for col in colunas:
    fig.add_trace(
        go.Scatter(
            x = df['index'],
            y = df[col],
            mode = "lines+markers"
        )
    )

In [12]:
fig

##### Como vou saber o que cada trace X significa? O que fazer para resolver isso?

In [13]:
colunas = list(colunas)

In [14]:
for col in colunas:
    fig.data[colunas.index(col)].name = col

In [15]:
fig

##### É vísível que essa figura tem muito espaço perdido nas bordas e falta alguns elementos como título dos eixos e do gráfico. Qual atributo da figura podemos modificar para estilizar o objeto Figure?

##### Margens

In [22]:
fig.update_layout(
    margin= dict(
        r=8,
        t=35,
        l=8,
        b=8
    )
)

##### Título do Gráfico

In [23]:
fig.layout.title = 'Gráfico desenvolvido com o arquivo anual_sousa_geral.csv'
fig

##### Título do Eixo X e Y

In [24]:
fig.layout.yaxis.title = 'Variável climática'
fig

In [29]:
print(fig.layout.xaxis.type)

None


In [30]:
fig.layout

Layout({
    'margin': {'b': 8, 'l': 8, 'r': 8, 't': 35},
    'template': '...',
    'title': {'text': 'Gráfico desenvolvido com o arquivo anual_sousa_geral.csv'},
    'xaxis': {'title': {'text': 'Anos'}},
    'yaxis': {'title': {'text': 'Variável climática'}}
})

In [34]:
fig.layout.xaxis.type = 'date'
fig.layout.xaxis.title = 'Tempo'

In [35]:
fig.layout

Layout({
    'margin': {'b': 8, 'l': 8, 'r': 8, 't': 35},
    'template': '...',
    'title': {'text': 'Gráfico desenvolvido com o arquivo anual_sousa_geral.csv'},
    'xaxis': {'title': {'text': 'Tempo'}, 'type': 'date'},
    'yaxis': {'title': {'text': 'Variável climática'}}
})

In [36]:
fig

### Arquivo 2

In [6]:
dados_diodo = pd.read_csv('./data/dados_diodo_zener.csv')

In [7]:
dados_diodo.head(10).T

Unnamed: 0,0,1,2,3,4,5,6,7,8,9
Tensão,0.80261,0.80775,0.80261,0.797469,0.80775,0.797469,0.797469,0.80261,0.797469,0.797469
Corrente,9.559504,9.374394,9.168716,8.973322,8.767644,8.57225,8.366572,8.171178,7.975784,7.775248


In [8]:
fig = go.Figure()

In [9]:
fig.add_trace(
    go.Scatter(
        x=dados_diodo['Tensão'],
        y=dados_diodo['Corrente'],
        name='Curva de polarização',
        visible=True,
        mode='lines',
        cliponaxis=False,
        opacity=0.8,
        marker_color='red',
    )
)

Quero um retangulo que envolva as regições de polarização direta e reversa...

In [10]:
max_x = max(dados_diodo['Tensão'])
min_x = min(dados_diodo['Tensão'])

max_y = max(dados_diodo['Corrente'])
min_y = min(dados_diodo['Corrente'])

In [11]:
fig.add_trace(
    go.Scatter(
        x=[min_x*1.1,-0.05, -0.05, min_x*1.1,min_x*1.1],
        y=[min_y*1.1,min_y*1.1, -0.05, -0.05,min_y*1.1],
        name='Polarização Reversa',
        visible=True,
        mode='lines',
        cliponaxis=False,
        opacity=0.8,
        marker_color='green',
    )
)

In [12]:
fig.add_trace(
    go.Scatter(
        x=[max_x*1.1,0.05, 0.05, max_x*1.1,max_x*1.1],
        y=[max_y*1.1,max_y*1.1, 0.05, 0.05,max_y*1.1],
        name='Polarização Reversa',
        visible=True,
        mode='lines',
        cliponaxis=False,
        opacity=0.8,
        marker_color='blue',
    )
)

##### E se quisessemos dividir as duas polarizações em dois gráficos lado a lado? Podemos criar subplots...

In [13]:
from plotly.subplots import make_subplots

In [14]:
fig = make_subplots(rows=1,cols=2)

In [15]:
fig.add_trace(
    go.Scatter(
        x=dados_diodo[dados_diodo['Tensão'] <= 0]['Tensão'],
        y=dados_diodo[dados_diodo['Tensão'] <= 0]['Corrente'],
        name='Polarização Reversa',
        visible=True,
        mode='lines+markers',
        cliponaxis=False,
        opacity=0.8,
        marker_color='red',
    ),
    row=1,
    col=1
)

In [16]:
fig.add_trace(
    go.Scatter(
        x=dados_diodo[dados_diodo['Tensão'] >= 0]['Tensão'],
        y=dados_diodo[dados_diodo['Tensão'] >= 0]['Corrente'],
        name='Polarização Direta',
        visible=True,
        mode='lines+markers',
        cliponaxis=False,
        opacity=0.8,
        marker_color='blue',
    ),
    row=1,
    col=2
)

In [19]:
fig.update_layout(
    xaxis_title='Tensão',
    yaxis_title='Corrente',
    margin= dict(
        r=8,
        t=35,
        l=8,
        b=8
    )
)

In [27]:
fig.update_layout(
    plot_bgcolor= '#082255',
    paper_bgcolor='#082255',
    font_color= '#fff',
)

fig.data[0].marker.size=20
fig.data[1].marker.size=15

In [28]:
fig

### Arquivo 3

In [31]:
dados_sonda = pd.read_csv('./data/dados_sonda_SRC.csv',sep=';')

In [32]:
dados_sonda.head()

Unnamed: 0,id,year,day,datetm,min,ws_25,wd_25,tp_25,ws_50,wd_50,tp_50
0,25,2009,1,01/01/2009 00:00,0,6.756,140.9,24.82,7.64,138.5,-75.0
1,25,2009,1,01/01/2009 00:10,10,6.417,140.2,24.63,7.49,137.8,-75.0
2,25,2009,1,01/01/2009 00:20,20,7.99,138.8,24.43,9.14,136.3,-75.0
3,25,2009,1,01/01/2009 00:30,30,7.12,142.2,24.21,8.13,139.1,-75.0
4,25,2009,1,01/01/2009 00:40,40,7.01,141.4,24.02,8.08,139.5,-75.0


#### É necessário padronizar as datas com o formato %Y/%m/%d %H:%M:%S

**Link de apoio:** https://plotly.com/python/time-series/#time-series-using-axes-of-type-date

In [33]:
dados_sonda['datetm']=pd.to_datetime(dados_sonda['datetm'].astype(str), format='%d/%m/%Y %H:%M')

In [34]:
dados_sonda['datetm']

0      2009-01-01 00:00:00
1      2009-01-01 00:10:00
2      2009-01-01 00:20:00
3      2009-01-01 00:30:00
4      2009-01-01 00:40:00
               ...        
4459   2009-01-31 23:10:00
4460   2009-01-31 23:20:00
4461   2009-01-31 23:30:00
4462   2009-01-31 23:40:00
4463   2009-01-31 23:50:00
Name: datetm, Length: 4464, dtype: datetime64[ns]

In [52]:
print(f'Quantidade de colunas no DataFrame: {len(dados_sonda.columns)}')

Quantidade de colunas no DataFrame: 11


In [64]:
fig = go.Figure()

In [65]:
fig.add_trace(
    go.Scatter(
        x = dados_sonda['datetm'],
        y = dados_sonda['ws_25'],
        mode = "lines+markers",
    )
)

In [66]:
print(fig.layout.xaxis.type)

None


In [67]:
fig.layout.xaxis.type = 'date'

In [68]:
fig

In [76]:
# fig.layout.xaxis.type = 'date'
fig.update_xaxes(
    dtick="M1",
    tickformat="Dia %d %H:%M\n%b\n%Y",
    ticklabelmode='instant', #'period',
)

Desafio - Aumentar o número de _ticks_ no eixo x, ou seja, mostrar pelo o número dos dias pares do mês de Janeiro de 2009.

**Link de Apoio:** https://plotly.com/python/axes/

In [79]:
fig

## O objeto `config` para ajustes na visualização

**Link de Apoio:** https://plotly.com/python/configuration-options/

In [85]:
fig.show(config = {'staticPlot': True})

In [83]:
fig.show(config = {
    'displayModeBar': True, # barra de ferramentas do gráfico fixa
    'scrollZoom': True, # zoom ativado
    'displaylogo': False, # retirar o logo Plotly
    'toImageButtonOptions': {
        'format': 'png', # png, svg, jpeg
        'filename': 'grafico_curso_PET', # nome do arquvio imagem exportado
        'height': 500,
        'width': 900,
        'scale': 1,
    },
    'editable': True, # ativa a edição dos títulos do gráfico e dos eixos
    'modeBarButtonsToRemove': [ # ferramentas do gráfico removidas
        'toggleSpikelines',
        'hoverCompareCartesian',
        'select2d', # acho que essa daqui pode retornar uma vez que não estou utilizando "event+select" nos gráficos
        'lasso2d',
        'resetScale2d'
    ],
    'modeBarButtonsToAdd':[ # ferramentas do gráfico adicionadas
        'drawline','drawopenpath','eraseshape'
    ]
})

AttributeError: config

## Expotando Figuras em diferentes formatos

In [None]:
fig = go.Figure()

fig.add_trace(
    go.scatter(
        x=[i for i in range(0,10)],
        y=[i**2 for i in range(0,10)],
        mode='lines+markers',
        name='Reta f(x)=x^2'
    )
)

fig

In [None]:
fig.config = {
    'displayModeBar': True, # barra de ferramentas do gráfico fixa
    'scrollZoom': True, # zoom ativado
    'displaylogo': False, # retirar o logo Plotly
    'toImageButtonOptions': {
        'format': 'png', # png, svg, jpeg
        'filename': 'graph__mm_ufpb', # nome do arquvio imagem exportado
        'height': 500,
        'width': 900,
        'scale': 1,
    },
    'editable': True, # ativa a edição dos títulos do gráfico e dos eixos
    'modeBarButtonsToRemove': [ # ferramentas do gráfico removidas
        'toggleSpikelines',
        'hoverCompareCartesian',
        'select2d', # acho que essa daqui pode retornar uma vez que não estou utilizando "event+select" nos gráficos
        'lasso2d',
        'resetScale2d'
    ],
    'modeBarButtonsToAdd':[ # ferramentas do gráfico adicionadas
        'drawline','drawopenpath','eraseshape'
    ]
}

## Tabelas com a biblioteca Plolty

In [23]:
import plotly.graph_objects as go

In [24]:
fig = go.Figure(
    data=[
        go.Table(
            header=dict(
                values=['A Scores', 'B Scores'],
                line_color='darkslategray',
                fill_color='lightskyblue',
                align='left'),
            cells=dict(
                values=[[100, 90, 80, 90], # 1st column
                       [95, 85, 75, 95]], # 2nd column
               line_color='darkslategray',
               fill_color='lightcyan',
               align='left'
            )
        )
    ]
)

In [25]:
fig.update_layout(width=500, height=300)