In [2]:
import pandas as pd
import numpy as np
import plotly.express as px

# CRIAÇÃO DO DATAFRAME

In [3]:
# Criando um DataFrame
idades = np.random.randint(20, 60, 20) #  idades aleatórias entre 20 e 60
salarios = idades * np.random.randint(80, 120, 20) # salários relacionados com a idade
pontuacoes = salarios * np.random.uniform(0.5, 1.5, 20) # pontuações relacionadas ao salário
profissoes = ['Engenheiro', 'Professor', 'Médico', 'Advogado', 'Designer', 'Analista', 'Gerente', 'Programador']
estado_civil = ['Casado', 'Solteiro', 'Viúvo', 'Divorciado']

novo_data = {
    'Idade': idades,
    'Salario': salarios,
    'Pontuaçao': pontuacoes.round(2),
}

dados = pd.DataFrame(novo_data)
dados['Profissao'] = np.random.choice(profissoes, size = len(dados))
dados['Estado_Civil'] = np.random.choice(estado_civil, size = len(dados))
dados.head(10)


Unnamed: 0,Idade,Salario,Pontuaçao,Profissao,Estado_Civil
0,32,3008,2293.32,Designer,Casado
1,21,2121,2811.34,Médico,Viúvo
2,38,3648,4932.9,Gerente,Viúvo
3,30,2640,1887.04,Gerente,Casado
4,42,4704,2965.39,Advogado,Solteiro
5,36,3636,2558.98,Gerente,Divorciado
6,29,2755,2832.86,Analista,Divorciado
7,45,4725,4792.98,Gerente,Solteiro
8,53,4505,3915.88,Programador,Divorciado
9,59,5546,4482.72,Programador,Casado


## Gráfico de Barras

In [43]:
# Calculando a média do salário por profissão
salario_por_profissao = dados.groupby('Profissao')['Salario'].mean().reset_index().sort_values('Salario', ascending = True)

fig = px.bar(
    salario_por_profissao, # fonte de dados
    x = 'Salario', # variável do eixo X
    y = 'Profissao', # variável do eixo Y
    orientation = 'h', # h = horizontal | v = vertical
    title = 'Salário Por Profissão', # Título do gráfico
    labels = {
        'Salario': 'Salário Médio', # rótulo eixo X
        'Profissao': 'Profissão' # rótulo eixo Y
    }
)

fig.show()

## Gráfico de Barras com Heatmap


In [99]:
# Calculando a média do salário por profissão
salario_por_profissao = dados.groupby('Profissao')['Salario'].mean().reset_index()

# CRIANDO O GRÁFICO
fig = px.bar(
    salario_por_profissao,
    x = 'Profissao',
    y = 'Salario',
    title = 'Salário Por Profissão',
    orientation = 'v',
    labels = {
        'Profissao': 'Profissão',
        'Salario': 'Salário Médio'
    },
    color = 'Salario', # Especificando a cor baseada nos valores dos salários ---> HEATMAP
    color_continuous_scale = 'temps', # ---> muda a cor do heatmap
    width = 800 # Definindo a largura do gráfico em pixels
)

fig.show()

## Mapa de árvore

In [52]:
# Agrupando os dados por profissão e estado civil e depois calculando a média de salário de cada
salario_por_profissao_e_estado_civil = dados.groupby(['Profissao', 'Estado_Civil'])['Salario'].mean().reset_index().sort_values('Salario', ascending = False)
print(f'{salario_por_profissao_e_estado_civil}\n')

fig = px.treemap(
    salario_por_profissao_e_estado_civil,
    path = ['Profissao', 'Estado_Civil'], # Variáveis categóricas
    values = 'Salario', # Variável numérica
    title = 'Salário Por Profissão e Estado Civil',
    labels = {
        'Salario': 'Salários'
    },
    color = 'Salario', # É possivel colocar em outra variável para categorizar a cor
    width = 900
)

fig.show()



      Profissao Estado_Civil  Salario
13  Programador       Casado   5546.0
0      Advogado   Divorciado   4823.0
9       Gerente     Solteiro   4725.0
1      Advogado     Solteiro   4704.0
14  Programador   Divorciado   4505.0
12    Professor     Solteiro   4429.0
6    Engenheiro     Solteiro   4118.0
3      Designer       Casado   3679.0
4      Designer   Divorciado   3662.0
10      Gerente        Viúvo   3648.0
8       Gerente   Divorciado   3636.0
5    Engenheiro       Casado   3399.0
2      Analista   Divorciado   3117.5
7       Gerente       Casado   2640.0
11       Médico        Viúvo   2121.0



## Boxplot

In [59]:
# CRIANDO O GRÁFICO
fig = px.box(
    dados,
    y = 'Idade',
    title = 'Boxplot de Idade',
    width = 900
)

fig.show()

## Gráfico de linha

In [114]:
# Calculando a média do salário por idade
salario_por_idade = dados.groupby('Idade')['Salario'].mean().reset_index()
print(salario_por_idade)

fig = px.line(
    salario_por_idade,
    x = 'Idade',
    y = 'Salario',
    width = 900,
    text = 'Salario' # ---> Adiciona os rótulos de dados
)

# AJUSTANDO OS RÓTULOS
fig.update_traces(textposition = 'top center')

fig.show()

    Idade  Salario
0      21   2121.0
1      28   2492.0
2      29   2755.0
3      30   3060.0
4      32   3008.0
5      33   3399.0
6      36   3636.0
7      38   3743.0
8      42   4095.0
9      43   4429.0
10     45   4725.0
11     49   4312.0
12     50   4950.0
13     53   4664.0
14     59   5546.0


## Link da documentação da biblioteca

https://plotly.com/python/plotly-express/