<h2 style="
    color: white; 
    text-align: center; 
    background-color: #000000ff; 
    border-radius: 10px;
    padding: 10px;">

**Trabajo de Recursamiento**

</h2>
<h3 style="
    color: white; 
    text-align: left; 
    background-color: #000000ff; 
    border-radius: 10px;
    padding: 10px;">

**Creado por:** T.S.U. Omar Lemuel Espejel Lira 

**Asignatura:** Extraccion de Conocimientos en Bases de Datos

**PE:** Ingeniería en Desarrollo y Gestión de Software 

**Docente:** M.T.I. Marco Antonio Ramíerez Hernández
</h3>



---

## 📄 **Resumen del proyecto: Análisis global de clientes de comercio electrónico**

En este proyecto, se utilizó un conjunto de datos sintéticos globales de clientes de comercio electrónico, que contiene el historial de transacciones de cada cliente, su comportamiento de fidelización, el riesgo de fraude y la probabilidad de abandono. El conjunto de datos incluye características demográficas, conductuales y transaccionales, lo que lo hace ideal para un proyecto completo de análisis de comercio minorista.

### **Objetivos del proyecto:**

* Predecir el riesgo de abandono y fraude
* Segmentar a los clientes mediante clusterización
* Generar visualizaciones y paneles de control detallados

---

## 🤖 **Tecnologías de aprendizaje automático utilizadas**

### 🔍 **1. Aprendizaje supervisado: modelos de clasificación**

Entrenamos 10 modelos de clasificación para predecir la columna `is_fraudulent`:

| Modelo                        | Propósito                                 | Tipo                  |
| ---------------------------- | ----------------------------------------- | --------------------- |
| Logistic Regression          | Clasificador lineal básico                | Modelo Lineal         |
| K-Nearest Neighbors (KNN)    | Decisión basada en vecinos más cercanos  | Basado en Instancias  |
| Support Vector Machine (SVM) | Separación de clases con hiperplanos     | Basado en Márgenes    |
| Decision Tree                | Clasificación basada en reglas           | Basado en Árbol       |
| Random Forest                | Conjunto de múltiples árboles de decisión | Ensamble              |
| Gradient Boosting            | Corrige errores del modelo anterior       | Boosting              |
| XGBoost                      | Versión avanzada de Gradient Boosting     | Boosting              |
| LightGBM                     | Boosting rápido y ligero                  | Boosting              |
| AdaBoost                     | Aprende con clasificadores débiles ponderados | Boosting         |
| Naive Bayes                  | Clasificación basada en probabilidad      | Probabilístico        |


✔️ Cada modelo se evaluó utilizando “exactitud”, “precisión”, “recuperación” y “puntuación F1”.

---

### 🧩 **2. Aprendizaje no supervisado: modelos de agrupamiento**

Utilizamos tres modelos de clusterización para la segmentación de clientes:

| Modelo                   | Técnica                   | Uso                                        |
| ------------------------ | ------------------------- | ------------------------------------------ |
| KMeans                   | Clustering basado en centros | Agrupar clientes con comportamientos similares |
| DBSCAN                   | Clustering basado en densidad | Identificar grupos propensos al fraude o anomalías |
| Agglomerative Clustering | Agrupamiento jerárquico     | Comprender las relaciones entre clústeres     |


✔️ Se utilizó PCA para la visualización 2D de clústeres.

---

### 📊 **3. Visualización y panel de control**

Se crearon visualizaciones interactivas y paneles de control con Plotly y Matplotlib:

* Tasa de abandono vs. fidelización
* Tasa de fraude por país
* Perfiles de clientes por clúster

---

## 🚀 **Conclusion**

Combinando aprendizaje automático y visualización:

* Predije clientes fraudulentos y propensos a la pérdida de clientes
* Realicé una segmentación significativa de clientes
* Analicé el comportamiento de los clientes para una mejor toma de decisiones

Este proyecto simula con éxito un entorno real de análisis de comercio electrónico, lo que facilita el modelado predictivo y la planificación estratégica.

---

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Importamos librerias
</h3>


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

sns.set(style="whitegrid")

import warnings
warnings.filterwarnings("ignore")


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Cargar conjunto de datos
</h3>


In [None]:
df = pd.read_csv("C:/Users/olespejel_externo/Downloads/archive/synthetic_ecommerce_churn_dataset.csv")
df.head()


### 📝 Explicación del código anterior
- Se está cargando el conjunto de datos desde un archivo CSV usando `pandas`. Esto permite trabajar con datos estructurados como si fueran una hoja de cálculo.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Explora el conjunto de datos
</h3>


In [None]:
df.info()
df.describe()


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
df.isnull().sum()


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
df["email_open_rate"].head()

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
df["avg_order_value"].head()

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
df.shape

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;"> 
Las columnas numéricas contienen valores nan.
</h3>


In [None]:
df['avg_order_value'].fillna(df['avg_order_value'].mean(), inplace=True)
df['email_open_rate'].fillna(df['email_open_rate'].mean(), inplace=True)


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Valor único de la columna categórica
</h3>


In [None]:
df['gender'].value_counts()
df['country'].nunique()
df['preferred_category'].value_counts()


### 📝 Explicación del código anterior
- Se está agrupando o contando datos para obtener distribuciones, como cuántos clientes hay por país o por género.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Visualización - Distribución de género
</h3>


In [None]:
sns.countplot(data=df, x='gender', palette='Set2')
plt.title("Gender Distribution")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Distribución de edad
</h3>


In [None]:
sns.histplot(df['age'], bins=20, kde=True)
plt.title("Age Distribution of Customers")
plt.xlabel("Age")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Clientes fraudulentos vs no fraudulentos
</h3>


In [None]:
sns.countplot(data=df, x='is_fraudulent', palette='Set1')
plt.title("Fraudulent vs Non-Fraudulent Customers")
plt.xticks([0,1], ['Not Fraud', 'Fraud'])
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Distribución de la puntuación de fidelidad
</h3>


In [None]:
sns.histplot(df['loyalty_score'], bins=30, color='green')
plt.title("Distribution of Loyalty Score")
plt.xlabel("Loyalty Score")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Distribución del riesgo de abandono
</h3>


In [None]:
sns.histplot(df['churn_risk'], bins=30, color='orange')
plt.title("Churn Risk Distribution")
plt.xlabel("Churn Risk")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Recuento de clientes por país
</h3>


In [None]:
top_countries = df['country'].value_counts().nlargest(10)
sns.barplot(x=top_countries.values, y=top_countries.index, palette="viridis")
plt.title("Top 10 Countries by Customer Count")
plt.xlabel("Number of Customers")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Valores promedio del pedido vs puntuación de fidelidad
</h3>


In [None]:
sns.scatterplot(data=df, x='avg_order_value', y='loyalty_score', hue='is_fraudulent')
plt.title("Avg Order Value vs Loyalty Score (with Fraud Indicator)")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Distribución de la tasa de apertura de correo electrónico
</h3>


In [None]:
sns.boxplot(data=df, x='gender', y='email_open_rate', palette='coolwarm')
plt.title("Email Open Rate by Gender")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Mapa de calor de correlación
</h3>


In [None]:
plt.figure(figsize=(10, 6))
corr = df[['age', 'avg_order_value', 'total_orders', 'last_purchase', 'loyalty_score', 'churn_risk']].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm', linewidths=0.5)
plt.title("Correlation Matrix")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Puntuación de fidelización vs. riesgo de abandono
</h3>


In [None]:
sns.scatterplot(data=df, x='loyalty_score', y='churn_risk', hue='is_fraudulent')
plt.title("Loyalty Score vs Churn Risk")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Categoría de producto preferida
</h3>


In [None]:
top_categories = df['preferred_category'].value_counts().nlargest(10)
sns.barplot(x=top_categories.values, y=top_categories.index, palette='muted')
plt.title("Top 10 Preferred Product Categories")
plt.xlabel("Number of Customers")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Distribución total de pedidos
</h3>


In [None]:
sns.histplot(df['total_orders'], bins=50, color='purple')
plt.title("Total Orders Distribution")
plt.xlabel("Number of Orders")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Tiempo transcurrido desde que el cliente se unió
</h3>


In [None]:
df['customer_since'] = pd.to_datetime(df['customer_since'])
df['years_with_company'] = datetime.now().year - df['customer_since'].dt.year

sns.histplot(df['years_with_company'], bins=10)
plt.title("Years Since Customer Joined")
plt.xlabel("Years with Company")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Puntuación de fidelidad por país
</h3>


In [None]:
top_countries = df['country'].value_counts().nlargest(5).index
sns.boxplot(data=df[df['country'].isin(top_countries)], x='country', y='loyalty_score')
plt.title("Loyalty Score by Country")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Tasa de fraude por país
</h3>


In [None]:
fraud_rate = df.groupby('country')['is_fraudulent'].mean().sort_values(ascending=False).head(10)
fraud_rate.plot(kind='barh', color='red')
plt.title("Top 10 Countries with Highest Fraud Rate")
plt.xlabel("Fraud Rate")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Preparación del conjunto de datos
</h3>


In [None]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, LabelEncoder

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
# Categorical encode (gender, preferred_category, country)
cat_cols = ['gender', 'preferred_category', 'country']
df_encoded = pd.get_dummies(df, columns=cat_cols, drop_first=True)

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
# Target (binary classification): is_fraudulent
X = df_encoded.drop(['customer_id', 'is_fraudulent', 'customer_since'], axis=1)
y = df_encoded['is_fraudulent']

### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

In [None]:
# Scaling
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

### 📝 Explicación del código anterior
- Este bloque entrena un modelo de machine learning o realiza predicciones. Se usa `fit()` para entrenar y `predict()` para generar resultados sobre datos nuevos.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
10 modelos de clasificación
</h3>


In [None]:
from sklearn.metrics import accuracy_score, classification_report
def evaluate_model(model, name):
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    acc = accuracy_score(y_test, y_pred)
    print(f"\n{name} Accuracy: {acc:.4f}")
    print(classification_report(y_test, y_pred))


### 📝 Explicación del código anterior
- Este bloque entrena un modelo de machine learning o realiza predicciones. Se usa `fit()` para entrenar y `predict()` para generar resultados sobre datos nuevos.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Logistic Regression
</h3>


In [None]:
from sklearn.linear_model import LogisticRegression
evaluate_model(LogisticRegression(), "Logistic Regression")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 K-Nearest Neighbors
</h3>


In [None]:
from sklearn.neighbors import KNeighborsClassifier
evaluate_model(KNeighborsClassifier(), "K-Nearest Neighbors")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Support Vector Machine
</h3>


In [None]:
from sklearn.svm import SVC
evaluate_model(SVC(), "Support Vector Classifier")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Decision Tree
</h3>


In [None]:
from sklearn.tree import DecisionTreeClassifier
evaluate_model(DecisionTreeClassifier(), "Decision Tree")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Random Forest
</h3>


In [None]:
from sklearn.ensemble import RandomForestClassifier
evaluate_model(RandomForestClassifier(), "Random Forest")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 XGBoot
</h3>


In [None]:
from xgboost import XGBClassifier
evaluate_model(XGBClassifier(use_label_encoder=False, eval_metric='logloss'), "XGBoost")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 Greadient Boosting
</h3>


In [None]:
from sklearn.ensemble import GradientBoostingClassifier
evaluate_model(GradientBoostingClassifier(), "Gradient Boosting")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
 AdaBoot
</h3>


In [None]:
from sklearn.ensemble import AdaBoostClassifier
evaluate_model(AdaBoostClassifier(), "AdaBoost")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
  Naive Bayes
</h3>


In [None]:
from sklearn.naive_bayes import GaussianNB
evaluate_model(GaussianNB(), "Naive Bayes")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
  LightGBM
</h3>


In [None]:
from lightgbm import LGBMClassifier
evaluate_model(LGBMClassifier(), "LightGBM")


### 📝 Explicación del código anterior
- Este bloque realiza una operación de análisis, limpieza o transformación de los datos. Es parte del flujo de preparación del dataset.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
Modelos de agrupación
</h3>


In [None]:
from sklearn.cluster import KMeans, DBSCAN, AgglomerativeClustering
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA

clust_features = ['avg_order_value', 'total_orders', 'loyalty_score', 'email_open_rate', 'churn_risk']
X_clust = df[clust_features].copy()
X_clust_scaled = StandardScaler().fit_transform(X_clust)

# 2D visualisation
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_clust_scaled)


### 📝 Explicación del código anterior
- Este bloque entrena un modelo de machine learning o realiza predicciones. Se usa `fit()` para entrenar y `predict()` para generar resultados sobre datos nuevos.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
  KMeans Clustering
</h3>


In [None]:
kmeans = KMeans(n_clusters=3, random_state=42)
df['kmeans_cluster'] = kmeans.fit_predict(X_clust_scaled)

plt.scatter(X_pca[:, 0], X_pca[:, 1], c=df['kmeans_cluster'], cmap='Set1')
plt.title("KMeans Clustering (3 clusters)")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
  DBSCAN Clustering
</h3>


In [None]:
dbscan = DBSCAN(eps=1.2, min_samples=5)
df['dbscan_cluster'] = dbscan.fit_predict(X_clust_scaled)

plt.scatter(X_pca[:, 0], X_pca[:, 1], c=df['dbscan_cluster'], cmap='Set2')
plt.title("DBSCAN Clustering")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.

<h3 style="
    color: white; 
    text-align: center; 
    background-color: #3498db; 
    border-radius: 10px;
    padding: 10px;">
  Hierarchical Clustering
</h3>


In [None]:
agglo = AgglomerativeClustering(n_clusters=3)
df['agglo_cluster'] = agglo.fit_predict(X_clust_scaled)

plt.scatter(X_pca[:, 0], X_pca[:, 1], c=df['agglo_cluster'], cmap='Set3')
plt.title("Agglomerative Clustering")
plt.show()


### 📝 Explicación del código anterior
- Aquí se genera una gráfica con `Seaborn` o `Matplotlib`. Estas herramientas ayudan a visualizar los datos para identificar patrones o distribuciones relevantes.