In [1]:
import pandas as pd
import plotly.express as px

clientes = pd.read_csv('test.csv')

clientes.head(5)

clientes.columns = ['id', 'Cliente id', 'Sobrenome', 'Placar de credito', 'Localização', 'Genero', 'Idade', 'Tenure', 'Balanço', 'Numero de produtos', 'Possui cartao de credito?', 'É ativo?', 'Salario estimado']

clientes

Unnamed: 0,id,Cliente id,Sobrenome,Placar de credito,Localização,Genero,Idade,Tenure,Balanço,Numero de produtos,Possui cartao de credito?,É ativo?,Salario estimado
0,165034,15773898,Lucchese,586,France,Female,23.0,2,0.00,2,0.0,1.0,160976.75
1,165035,15782418,Nott,683,France,Female,46.0,2,0.00,1,1.0,0.0,72549.27
2,165036,15807120,K?,656,France,Female,34.0,7,0.00,2,1.0,0.0,138882.09
3,165037,15808905,O'Donnell,681,France,Male,36.0,8,0.00,1,1.0,0.0,113931.57
4,165038,15607314,Higgins,752,Germany,Male,38.0,10,121263.62,1,1.0,0.0,139431.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
110018,275052,15662091,P'eng,570,Spain,Male,29.0,7,116099.82,1,1.0,1.0,148087.62
110019,275053,15774133,Cox,575,France,Female,36.0,4,178032.53,1,1.0,1.0,42181.68
110020,275054,15728456,Ch'iu,712,France,Male,31.0,2,0.00,2,1.0,0.0,16287.38
110021,275055,15687541,Yegorova,709,France,Female,32.0,3,0.00,1,1.0,1.0,158816.58


In [2]:
# Transformando um value_counts() em um dataframe (por padrão o resultado é uma Series)
genero = pd.DataFrame(clientes['Genero'].value_counts())
# Resetando o index pra poder trabalhar com a coluna 'Genero' que por padrão fica como index
genero.reset_index(inplace=True)
# Renomeando as colunas
genero.columns = ['Genero', 'Valores']

# Plotando o gráfico
fig = px.pie(
    genero,
    values='Valores',
    names='Genero',
    title='Gênero dos Clientes',
    # colors.qualitative tem diversas opções de combinações de cores, eu escolhi a combinação T10
    color_discrete_sequence=px.colors.qualitative.T10
)

# interessante pesquisar mais sobre o método update_traces() na documentação do Plotly!!
fig.update_traces(
    textposition='inside', 
    textinfo='percent+label',
)

fig.show()

In [3]:
fig = px.pie(
    clientes,
    values='Numero de produtos',
    names='Localização',
    title='Compras por Localização',
    color_discrete_sequence=px.colors.qualitative.Light24
)

fig.update_traces(
    textposition='outside',
    textinfo='percent+label',
    # Alterando o visual com uma borda
    marker=dict(line=dict(color='#000000', width=1))
)

fig.show()

In [4]:
local_agrupado = clientes.groupby(clientes['Localização'])[['Placar de credito', 'Idade','Salario estimado']].mean().reset_index()

fig = px.bar(
    local_agrupado,
    x='Localização',
    y='Placar de credito',
    color='Localização',
    title='Média de placar de Crédito por Localização',
)

# Diminuí o range para evidenciar o desnivelamento entre as colunas
# Com ranges grandes ficava imperceptível notar o maior
fig.update_yaxes(
      range=[650, 658]
)

fig.show()

In [5]:
fig = px.histogram(
    clientes,
    x='Tenure',
    color='Localização',
    category_orders={"Tenure":['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10']},
    title='Nível de estabilidade por País'
)

fig.update_xaxes(type='category')

fig.show()

In [6]:
# Utilizando testes do gráfico de dispersão no plotly

fig = px.scatter(
    clientes,
    x='Idade',
    y='Placar de credito',
    color='Localização',
    size='Tenure',
    symbol='Localização'
)

fig.show()