## Carregamento os dados

In [1]:
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

In [2]:
df_dsa = pd.read_csv('dados_clientes.csv')

In [3]:
df_dsa.head(10)

Unnamed: 0,id,idade,renda_anual,pontuacao_gastos
0,1,56,94740,90
1,2,69,136352,50
2,3,46,86617,62
3,4,32,114841,97
4,5,60,36896,51
5,6,25,145729,37
6,7,38,66175,96
7,8,56,27805,87
8,9,36,25237,78
9,10,40,135247,29


In [7]:
df_dsa[['idade', 'renda_anual', 'pontuacao_gastos']].describe()

Unnamed: 0,idade,renda_anual,pontuacao_gastos
count,500.0,500.0,500.0
mean,44.732,81557.166,48.512
std,15.239707,36764.379945,29.556946
min,18.0,20384.0,0.0
25%,32.0,49172.75,24.0
50%,45.0,79219.0,48.5
75%,57.0,113017.25,73.25
max,70.0,149695.0,100.0


## Pré-Processamento dos Dados

In [4]:
padronizador = StandardScaler()

In [5]:
dados_padronizados = padronizador.fit_transform(df_dsa[['idade', 'renda_anual', 'pontuacao_gastos']])

In [6]:
print(dados_padronizados)

[[ 0.74012478  0.35893538  1.40506904]
 [ 1.59401387  1.49192537  0.05039391]
 [ 0.08328703  0.13776654  0.45679645]
 ...
 [-0.31081563  0.32661636  0.18586143]
 [-1.23038848 -1.48706069  1.43893592]
 [-1.03333716 -0.96992912 -0.59307677]]


## Construção do Modelo de Machine Learning Para Segmentação de Clientes

In [7]:
k = 3

In [8]:
kmeans = KMeans(n_clusters = k)

In [9]:
kmeans.fit(dados_padronizados)



## Atribuímos os rótulos dos clusters aos clientes

In [10]:
df_dsa['cluster'] = kmeans.labels_

In [11]:
df_dsa.head(10)

Unnamed: 0,id,idade,renda_anual,pontuacao_gastos,cluster
0,1,56,94740,90,0
1,2,69,136352,50,1
2,3,46,86617,62,0
3,4,32,114841,97,1
4,5,60,36896,51,0
5,6,25,145729,37,1
6,7,38,66175,96,0
7,8,56,27805,87,0
8,9,36,25237,78,0
9,10,40,135247,29,1


## Salvamos o resultado em disco

In [12]:
df_dsa.to_csv('segmentos.csv', index = False)

## Gerando Relatório dos Segmentos de Clientes com Power BI no Jupyter Notebook

In [13]:
!pip install -q powerbiclient

## Carrega as funções usadas para autenticar e gerar  relatórios

In [19]:
from powerbiclient import QuickVisualize, get_dataset_config, Report
from powerbiclient.authentication import DeviceCodeLoginAuthentication

In [None]:
device_auth = DeviceCodeLoginAuthentication()

## Cria o relatório no Power BI

In [None]:
relatorio_PBI = QuickVisualize(get_dataset_config(df_dsa), auth = device_auth)

In [None]:
relatorio_PBI