# 🧩 Clusterização de Clientes com K-means

Este notebook realiza a segmentação de clientes utilizando o algoritmo K-means, baseado em idade, renda mensal e pontuação de gastos.

In [None]:
# 📁 Carregando os dados
import pandas as pd

# Suba o arquivo 'clientes_segmentacao.csv' no ambiente
df = pd.read_csv("clientes_segmentacao.csv")
df.head()

## 📊 Estatísticas descritivas

In [None]:
df.describe()

## 🔄 Padronização dos dados

In [None]:
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(df)

X_scaled[:5]

## 📈 Método do cotovelo para encontrar o número ideal de clusters

In [None]:
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

wcss = []
for k in range(1, 11):
    kmeans = KMeans(n_clusters=k, random_state=42, n_init=10)
    kmeans.fit(X_scaled)
    wcss.append(kmeans.inertia_)

plt.plot(range(1, 11), wcss, marker='o')
plt.xlabel('Número de Clusters')
plt.ylabel('WCSS')
plt.title('Método do Cotovelo')
plt.grid(True)
plt.show()

## 🚀 Aplicando K-means com 4 clusters

In [None]:
kmeans = KMeans(n_clusters=4, random_state=42, n_init=10)
df['Cluster'] = kmeans.fit_predict(X_scaled)
df.head()

## 🎯 Visualizando os clusters com Plotly

In [None]:
import plotly.express as px

fig = px.scatter(df, x='Renda_Mensal', y='Pontuacao_Gastos',
                 color='Cluster',
                 hover_data=['Idade'],
                 title='Clusters de Clientes')
fig.show()