# Introdução

Nesse notebook vamos aprender como criar gráficos de bolhas usando o python e uma biblioteca chamada plotly. 

Esse tipo de gráfico é bastante usado quando precisamos representar de forma eficaz a frequência de classificação de um objeto, por exemplo: imagine que você está em uma fábrica e precisa classificar objetos da seguinte forma:

Por cor: 
- Azul 
- Amarelo
- Vermelho
- Preto
- Verde

Por tipo:
- Cozinha
- Eletrônicos
- Esportes
- Ferramentas
- Moda

Antes de mais nada vamos importar esse conjunto de dados para nosso código. Para esse tutorial irei utilizar o dataset "produtos_para_venda". Portanto, vamos importar de dentro da pasta "data" o xls. A seguir vamos chamar o comando dates.head() para mostrar as primeiras 5 linhas do nosso dataset.

In [2]:
import pandas as pd

tbl = pd.read_excel("../data/produtos_para_venda.xlsx")
tbl.head()

Unnamed: 0,Produto,Cor,Tipo,Preço,estoque,localização
0,Pen drive 32 gb,Vermelho,Eletrônicos,20,40,São José do Rio preto
1,SSD 240 gb,verde,Eletrônicos,240,10,São paulo
2,Garfo,Azul,Cozinha,4,200,Ibirité
3,Assadeira grande,Preto,Cozinha,10,100,Boituva
4,Bola de basquete,Vermelho,Esportes,90,50,Cândido mota


Agora que nós já temos nosso conjunto de dados importados precisamos definir quem são nossos dados do gráfico de bolhas. Antes de mais nada, precisamos explicar que o gráfico de bolhas é formado por dois eixos (X e Y) e também um eixo adicional que é o tamanho da bolha. 

No nosso caso, vamos usar os eixos "cor", "tipo" e "estoque" como eixos X, Y, Z.

In [10]:
X = tbl["Cor"]
Y = tbl["Tipo"]
Z = tbl["estoque"]


Caso você possua uma tabela em que as colunas devem ser transformadas para "caber" em seu gráfico, você pode usar o método melt. Calma, eu vou explicar, imagine a seguinte tabela:

| Profissional | 2014 | 2015 | 2016 | 2017 |
|:------------:|:----:|:----:|:----:|:----:|
|   Encanador  |   1  |  12  |   6  |   7  |
|  Marceneiro  |   2  |   3  |  15  |   5  |
|   Pedreiro   |   5  |  10  |   3  |   8  |
|  Programador |  10  |  20  |  15  |  25  |

Se nós quisessemo montar um gráfico de bolhas com ela, primeiro precisamos que ela seja um dataframe:


In [4]:
trabalhadores = pd.read_excel("../data/dados_trabalhadores.xlsx")
trabalhadores

Unnamed: 0,Profissional,2014,2015,2016,2017
0,Encanador,1,12,6,7
1,Marceneiro,2,3,15,5
2,Pedreiro,5,10,3,8
3,Programador,10,20,15,25


Agora podemos usar o método "melt" para pivotar nossa tabela:

In [23]:
trab = trabalhadores.melt(['Profissional'])
trab['variable'] = trab.variable.astype(str)
trab.variable

0     2014
1     2014
2     2014
3     2014
4     2015
5     2015
6     2015
7     2015
8     2016
9     2016
10    2016
11    2016
12    2017
13    2017
14    2017
15    2017
Name: variable, dtype: object

A primeira coisa que precisamos fazer é ter certeza que você instalou a biblioteca no seu ambiente. Para isso você deve usar os comandos: 

```plaintext

# via pip:

pip install plotly==5.3.1

# ou conda:

conda install -c plotly plotly=5.3.1

```

In [7]:
import plotly.graph_objects as go

Agora vamos criar um gráfico de bolhas bastante simples apenas para testar se está tudo funcionando.

In [11]:
fig = go.Figure(data=[go.Scatter(
    x=["Abobora", "Batata", "Tomate", "Arroz"], 
    y=["Fruta", "Verdura", "Legume", "Grão"], 
    mode='markers', 
    marker_size=[40, 60, 80, 100])
])

fig.show()

Perfeito, agora podemos criar nosso gráfico apenas modificando os eixos...

In [12]:
fig = go.Figure(data=[go.Scatter(
    x= X.to_numpy(), 
    y= Y.to_numpy(), 
    mode='markers', 
    marker_size=Z.to_numpy())
])

fig.show()

O gráfico anterior é um pouco limitado, para criar um gráfico mais "robusto você pode criar um gráfico usando o "express" do plotly, veja o exemplo:

In [34]:
import plotly.express as px
df = px.data.gapminder()

fig = px.scatter(
    tbl, 
    x="Tipo", 
    y="Cor",
    size="estoque", 
    text="estoque",
    color="localização",
    hover_name="estoque", 
    size_max=60, 
    title="Produtos para venda"
)


fig.for_each_trace(lambda t: t.update(textfont_color="black"))
fig.update_traces(textfont_size=14)
fig.update_xaxes(title_font_size=15, tickfont_size=14, color="black")
fig.update_yaxes(title_font_size=15, tickfont_size=15, color="black")
fig.show()

Agora vamos gerar uma visualização dos nossos trabalhadores:
    

In [32]:
import plotly.express as px
df = px.data.gapminder()

fig = px.scatter(
    trab, 
    x="Profissional", 
    y="variable",
    size="value", 
    text="value",
    hover_name="value", 
    size_max=60, 
    labels = {
        "variable" : "Years"
    },
    title="Trabalhadores contratados"
)

fig.for_each_trace(lambda t: t.update(textfont_color="black"))
fig.update_traces(textfont_size=18)
fig.update_xaxes(title_font_size=16, tickfont_size=15, color="black")
fig.update_yaxes(title_font_size=16, tickfont_size=18, color="black")

fig.show()