# "Plotly: Estrutura da Biblioteca"
> "Uma visão geral sobre a estrutura de uma das bibliotecas analíticas mais poderosas no ecossistema Python!"

- toc: true
- branch: master
- badges: false
- comments: true
- author: Augusto dos Santos Pereira
- categories: [Plotly, Gráficos, Python]

In [55]:
# hide_input
# This cell is required for the export to HTML to work.
import plotly.io as pio
#pio.renderers.default = 'plotly_mimetype+notebook'
pio.renderers.default = 'colab'
# Default is plotly_mimetype+notebook, but jekyll fails to parse plotly_mimetype.
#pio.renderers.default = 'notebook_connected'
# Uncomment below to avoid using a CDN for plotly.js
# pio.renderers.default = 'notebook'

# Inject the missing require.js dependency.
from IPython.display import display, HTML
#js = '<script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" integrity="sha512-c3Nl8+7g4LMSTdrm621y7kf9v3SDPnhxLNhcjFJbKECVnmZHTdo+IRO05sNLTH/D3vA6u1X32ehoLC7WFVdheg==" crossorigin="anonymous"></script>'
#display(HTML(js))

## O Domínio da Ferramenta

O ecossistema Python de Ciência de Dados apresenta ferramentas diversas para obtenção, tratamento, análise, modelagem de dados, e deployment de resultados. Em uma ambiente tão diversificado de ferramentas, é impossível que tenhamos profundo conhecimento sobre cada uma das ferramentas que utilizamos no nosso fluxo de trabalho. Quanto mais no caso daquelas de que precisamos para acessar uma única função. Assim, precisamos ter um projeto de conhecimento sobre as ferramentas, classificando-as segundo o nível de relevância no nosso trabalho quotidiano. Nesse caso, aquelas menos importantes podem ter aprendidas com o jogo em andamento. Na hora que precisarmos delas, vamos ler a documentação ou ver um vídeo no YouTube. Quanto a outras ferramentas, mais rotineiras, precisamos ter uma noção geral de como funcionam e suas principais funcionalidades. Um terceiro grupo de ferramentas é formado por aquelas que serão a ponta de lança das nossas atividades. Nesses casos, nós vamos saber muito. Vamos conhecer a documentação com muita profundidade, entender os usos para os diversos subpacotes, as principais ferramentas, a lógica dos algoritmos utilizados, processos de otimização etc. 

Assim, este texto é destinado àqueles que querem aprender mais a fundo a utilizar a biblioteca Plotly para geração de produtos analíticos - gráficos, mapas e diagramas. Aqui vamos tentar avançar sobre a estrutura da biblioteca, para entendermos o que podemos fazer com cada um de seus subpacotes.

Adiante, vamos então falar dos sete subpacotes Plotly: **plotly.data**, **Plotly Express**, **plotly.colors**, **Graph Objects**, **Subplots**, **I/O**, e **Figure Factories**.

## Plotly Data

[Plotly Data](https://plotly.com/python-api-reference/generated/plotly.data.html#module-plotly.data) é uma biblioteca em que podemos encontrar _**datasets**_ para exercícios e práticas de elaboração de gráficos. Esses datasets conformam uma ótima maneira de se adquirir rápida prática na produção dos gráficos. Cada dataset tem uma função que o carrega em formato Panda DataFrame, conforme podemos ver adiante para as eleições para prefeito de Montreal em 2013, segundo os distritos eleitorais.

In [56]:
from plotly.data import election, medals_long, stocks # importando a função de carregamento de alguns datasets
df_election = election() # declarando o dataset como Pandas Data Frame e atribuindo à variável df
df_medals = medals_long()
df_stocks = stocks()

In [57]:
df_election.head(5) # verificando as cinco primeiras linhas do Data Frame Election

Unnamed: 0,district,Coderre,Bergeron,Joly,total,winner,result,district_id
0,101-Bois-de-Liesse,2481,1829,3024,7334,Joly,plurality,101
1,102-Cap-Saint-Jacques,2525,1163,2675,6363,Joly,plurality,102
2,11-Sault-au-Récollet,3348,2770,2532,8650,Coderre,plurality,11
3,111-Mile-End,1734,4782,2514,9030,Bergeron,majority,111
4,112-DeLorimier,1770,5933,3044,10747,Bergeron,majority,112


In [58]:
df_medals.head(5) # verificando as cinco primeiras linhas do Data Frame de medalhas

Unnamed: 0,nation,medal,count
0,South Korea,gold,24
1,China,gold,10
2,Canada,gold,9
3,South Korea,silver,13
4,China,silver,15


In [59]:
df_stocks.head(5) # verificando as cinco primeiras linhas do Data Frame de Ações

Unnamed: 0,date,GOOG,AAPL,AMZN,FB,NFLX,MSFT
0,2018-01-01,1.0,1.0,1.0,1.0,1.0,1.0
1,2018-01-08,1.018172,1.011943,1.061881,0.959968,1.053526,1.015988
2,2018-01-15,1.032008,1.019771,1.05324,0.970243,1.04986,1.020524
3,2018-01-22,1.066783,0.980057,1.140676,1.016858,1.307681,1.066561
4,2018-01-29,1.008773,0.917143,1.163374,1.018357,1.273537,1.040708


In [60]:
df_olimpics

Unnamed: 0,nation,medal,count
0,South Korea,gold,24
1,China,gold,10
2,Canada,gold,9
3,South Korea,silver,13
4,China,silver,15
5,Canada,silver,12
6,South Korea,bronze,11
7,China,bronze,8
8,Canada,bronze,12


## Plotly Express

**Plotly Express** é uma API de alto nível de abstração, ou seja é uma interface bastante simplificada a partir da qual se é possível fazer um quantidade riquíssima de produtos analíticos - gráficos, mapas e diagramas - com apenas uma linha de código. Isso é possível pois o pacote conta com dezenas de funções com uma grande quantidade de parâmetros e que tornam o trabalho de produção bastante intuitivo, sobretudo pois a orientação para a inserção de argumetos se encontra bem documentada e acessível no docstring e na documentação

{% include info.html text="Lembrando que **_docstring_** são os textos instrutivos que aparecem relacionados a funções e construtore de objetos em Python e que são acessíveis quando aplicamos a função help a esses objetos." %}

Vejamos na prática como fazer alguns gráficos com os dados importados. Primeiramente fazemos a importação do Plotly Express como px. Em seguida, utilizando a sua função bar, indicamos df_olimpics como o data_frame a ser considerado pela função e mapeamos as colunas nation, count e medal Adiante vemos que somente com o uso da função função bar 

In [61]:
import plotly.express as px # importando plotly express como px

fig_medals = px.bar( # chamando a função bard e atribuindo o gráfico à variável fig_medals
    data_frame=df_olimpics # indicação do Data Frame Olimpics como a fonte de dados para o gráfico
    , x='nation' # mapeamento da coluna nação ao eixo x
    , y='count' # mapeamento da coluna contagem ao eixo y
    , color='medal' # mapeamento da coluna medalha às cores
    , color_discrete_map={'gold':'rgb(238,232,170)', 'bronze':'rgb(205,133,63)', 'silver':'rgb(211,211,211)'} #especificação de cores
)

fig_medals.show() # chamada da renderização da figura