 **MÓDULO 12 - AULA 5**
# Analytics 2: Elementos Visuais - Gráficos Interativos


Para essa aula plotaremos alguns gráficos utilizando uma biblioteca que permite a criação de gráficos interativos.
Essa biblioteca é a ploty.express

In [2]:
! pip install pandas numpy plotly

Collecting plotly
  Downloading plotly-6.0.1-py3-none-any.whl.metadata (6.7 kB)
Collecting narwhals>=1.15.1 (from plotly)
  Downloading narwhals-1.38.2-py3-none-any.whl.metadata (9.4 kB)
Downloading plotly-6.0.1-py3-none-any.whl (14.8 MB)
   ---------------------------------------- 0.0/14.8 MB ? eta -:--:--
   ----------- ---------------------------- 4.2/14.8 MB 23.1 MB/s eta 0:00:01
   ------------------------------------ --- 13.4/14.8 MB 35.3 MB/s eta 0:00:01
   ---------------------------------------- 14.8/14.8 MB 34.6 MB/s eta 0:00:00
Downloading narwhals-1.38.2-py3-none-any.whl (338 kB)
Installing collected packages: narwhals, plotly
Successfully installed narwhals-1.38.2 plotly-6.0.1



[notice] A new release of pip is available: 25.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [1]:
import pandas as pd
import numpy as np
import plotly.express as px

In [2]:
idades = np.random.randint(20, 60, 20)
salarios = idades * np.random.randint(80, 120, 20)
pontuacoes = salarios * np.random.uniform(0.5, 1.5, 20)
profissoes = ['Engenheiro', 'Professor', 'Médico', 'Advogado', 'Designer',
              'Analista', 'Gerente', 'Programador']
estado_civil = ['Casado','Solteiro']   #Adicionando a iformação de estado civil


novo_data = {
    'Idade': idades,
    'Salário': salarios,
    'Pontuação': pontuacoes.round(2)
}
df = pd.DataFrame(novo_data)
df['Profissão'] = np.random.choice(profissoes, size=len(df))
df['estado_civil'] = np.random.choice(profissoes, size=len(df))
df.head(10)

Unnamed: 0,Idade,Salário,Pontuação,Profissão,estado_civil
0,54,4644,5401.7,Programador,Advogado
1,54,6426,4010.73,Advogado,Professor
2,40,3960,3434.57,Analista,Advogado
3,31,3317,3921.95,Programador,Advogado
4,31,2666,3616.94,Engenheiro,Engenheiro
5,34,3230,2408.61,Designer,Designer
6,52,5824,6849.35,Engenheiro,Programador
7,53,5194,5917.7,Professor,Médico
8,58,4988,2526.78,Médico,Médico
9,47,4183,2865.35,Gerente,Advogado


Começamos plotando um gráfico de barras horizontais com a média dos salários por profissão:

In [3]:
# Agrupando os dados do DataFrame por profissão e calculando a média do salário para cada profissão
salario_por_profissao = df.groupby('Profissão')['Salário'].mean().reset_index()

# Criando o gráfico de barras horizontais, muito semelhante a biblioteca matplot
fig = px.bar(salario_por_profissao, x='Salário', y='Profissão', orientation='h',
             title='Salários por Profissão',
             labels={'Salário': 'Salário Médio', 'Profissão': 'Profissão'})

# Exibindo o gráfico
fig.show()

Para termos a opção de mudar a cor e tamanho:

In [4]:

salario_por_profissao = df.groupby('Profissão')['Salário'].mean().reset_index()

fig = px.bar(salario_por_profissao, x='Salário', y='Profissão', orientation='h',
             title='Salários por Profissão',
             labels={'Salário': 'Salário Médio', 'Profissão': 'Profissão'},
             color='Salário',  # Especificando a cor baseada nos valores de salário
             width=800)        # Definindo a largura do gráfico em pixels

fig.show()

Outro visual muito bacana e interativo que essa biblioteca nos permite é o de gráficos de mapa de árvore, não vimos ele nos principais gráficos pois é pouco utilizado, mas nessa biblioteca ele é um dos gráficos com melhor interação:

In [5]:
# Aqui agrupamos os dados do DataFrame por profissão e estado civil, e calculando a média do salário para cada profissão e estado civil
salario_por_profissao_estado_civil = df.groupby(['Profissão', 'estado_civil'])['Salário'].mean().reset_index()

# Criando o gráfico de treemap com os salários por profissão, usando as cores para representar o estado civil
fig = px.treemap(salario_por_profissao_estado_civil,
                 path=['Profissão', 'estado_civil'],
                 values='Salário',
                 title='Salários por Profissão e Estado Civil',
                 color='estado_civil')
# Exibindo o gráfico
fig.show()

Agora vamos plotar um boxplot de idade:


In [6]:
# Criando o boxplot de idade
fig = px.box(df, y='Idade', title='Boxplot de Idade')

# Exibindo o gráfico
fig.show()

Notem que pelos visuais já virem bem completos de informação o código é muito mais simples de ser escrito. Essa biblioteca nos permite gráficos interativos com uma facilidade imensa de programação.

Para estudarem mais essa biblioteca e aprender mais sobre suas funcionalidades segue o link de documentação dela:
https://plotly.com/python/plotly-express/