## Supermarket Customer Segmentation

In [4]:
pip install yellowbrick

Collecting yellowbrick
  Downloading yellowbrick-1.5-py3-none-any.whl (282 kB)
     ------------------------------------ 282.6/282.6 kB 328.5 kB/s eta 0:00:00
Installing collected packages: yellowbrick
Successfully installed yellowbrick-1.5
Note: you may need to restart the kernel to use updated packages.


In [5]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.decomposition import PCA

from sklearn.cluster import KMeans, DBSCAN, AgglomerativeClustering
from yellowbrick.cluster import KElbowVisualizer
from sklearn.metrics import davies_bouldin_score, silhouette_score
from flask import Flask,jsonify,request,render_template

%matplotlib inline

np.random.seed(7)
plt.rcParams['figure.figsize'] = (16, 6)
# to change default colormap
sns.set(style="darkgrid")
sns.set_palette("pastel")

### 1. Introducción

La inversión y gasto en publicidad es el mayor problema de todos los negocios. Uno de las mayores contribuciones para este gasto es cometer el error de seleccionar audiencias de manera equivocada.

El objetivo de una campañia de publicidad es obtener la atención de muchos clientes. Además, de ser una estrategia para que muchas personas compren productos, y esto a su vez se convierta en retorno de dicha inversión.

### 1.1 Acerca de este proyecto

En este proyecto, exploraremos los datos recolectados por un supermercado sobre sus usuarios. Obtendremos algunos estadisticos sobre los clientes en general y sus habitos. Despues intetaremos dividir los clientes en segmentos usando varias tecnicas de clustering.

Vamos a sumergirnos en los cluster con el fin de determinar el correcto algoritmo de clusterización.
Al final del proyecto deberíamos de tener una descripción estadistica de varios segmentos de los clientes y sus habitos de consumo.

Así el supermercado puede utilizar estos segmentos con el fin de ofrecer mejor sus productos.

### 1.2 Acerca de los datos

El conjunto de datos conitene una descripción de los clientes ideales de una compañia. Contiene 29 columnas sobre los habitos y demografia de los clientes. Las caracteristifas estan dividas en 5 categorias:

#### Personas:

1. ID: Identificacion unica del cliente
2. Year_Birth: Año de nacimiento
3. Education: Nivel educativo del cliente
4. Marital_Status: Estado civil del cliente
5. Income: Ingresos familiares anuales
6. Kidhome: Número de niños en la familia
7. Teenhome: Número de adolescentes en la familia
8. Dt_Customer:  Fecha de creación del cliente en la empresa
9. Recency: Número de días desde la última compra
10. Complain: 1 si el cliente se ha quedado en los ultimos 2 años, 0 si no lo ha hecho

#### Productos:

11. MntWines: Cantidad gastada en vinos en los últimos 2 años
12. MntFruits: Cantidad gastada en frutas en los últimos 2 años
13. MntMeatProducts: Cantidad gastada en carne en los últimos 2 años
14. MntFishProducts: Cantidad gastada en pescado en los últimos 2 años
15. MntSweetProducts: Cantidad gastadas en dulces en los últimos 2 años
16. MntGoldProds: Cantidad gastada en productos premium en los últimos 2 años

#### Promociones: 

17. NumDealsPurchases: Número de compras hechso con descuento.
18. AcceptedCmp1: 1 si el cliente acepto la oferta en la primera campaña y 0 de otra forma.
19. AcceptedCmp2: 1 si el cliente acepto la oferta en la segunda campaña y 0 de otra forma.
20. AcceptedCmp3: 1 si el cliente acepto la oferta en la tercer campaña y 0 de otra forma.
21. AcceptedCmp4: 1 si el cliente acepto la oferta en la cuarta campaña y 0 de otra forma.
22. AcceptedCmp5: 1 si el cliente acepto la oferta en la quinta campaña y 0 de otra forma.
23. Response: 1 si el cliente acepto la oferta en la última campaña y 0 de otra forma.


#### Lugares:

24. NumWebPurchases: Número de compras hechas por medio del sitio web
25. NumCatalogPurchases: Número de compras realizadas por catalogo
26. NumStorePurchases: Número de compras hechas en las tiendas físicas.
27. NumWebVisitsMonth: Número de visitas al sitio web de la compañia en el ultimo mes.

#### Uncategorized:

28. Z_CostContact
29. Z_Revenue