In [None]:
# 5. **Modelos de Clustering**
   - **Utilidad:** Este grupo de métodos se utiliza para agrupar muestras similares en clusters. Es útil en tareas de clustering donde se busca encontrar agrupaciones naturales en los datos.
   - **Funciones comunes:**
     - **KMeans:** Clustering basado en k-means.
     - **AgglomerativeClustering:** Clustering aglomerativo jerárquico.
     - **DBSCAN:** Clustering basado en densidad.
     - **MeanShift:** Clustering basado en la estimación de la densidad.

In [None]:
## Carga de datos y preparación
Importamos el dataset Iris y las bibliotecas necesarias. X contiene las características.

In [1]:
from sklearn.datasets import load_iris
import pandas as pd

# Load the dataset
data = load_iris()
X = data.data

In [None]:
## KMeans
Entrenamos un modelo KMeans con 3 clusters y asignamos cada muestra a un cluster.

In [2]:
from sklearn.cluster import KMeans

# Initialize the KMeans model with 3 clusters
model = KMeans(n_clusters=3, random_state=42)

# Fit the model
model.fit(X)

# Predict the clusters
clusters = model.predict(X)

# Create a DataFrame for better visualization
df_clusters = pd.DataFrame(X, columns=data.feature_names)
df_clusters['Cluster'] = clusters

print("KMeans Clustering:")
print(df_clusters.head())

KMeans Clustering:
   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

   Cluster  
0        1  
1        1  
2        1  
3        1  
4        1  


In [None]:
## AgglomerativeClustering
Entrenamos un modelo de clustering aglomerativo jerárquico con 3 clusters y asignamos cada muestra a un cluster.

In [3]:
from sklearn.cluster import AgglomerativeClustering

# Initialize the AgglomerativeClustering model with 3 clusters
model = AgglomerativeClustering(n_clusters=3)

# Fit the model and predict the clusters
clusters = model.fit_predict(X)

# Create a DataFrame for better visualization
df_clusters = pd.DataFrame(X, columns=data.feature_names)
df_clusters['Cluster'] = clusters

print("Agglomerative Clustering:")
print(df_clusters.head())


Agglomerative Clustering:
   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

   Cluster  
0        1  
1        1  
2        1  
3        1  
4        1  


In [None]:
## DBSCAN
Entrenamos un modelo DBSCAN para clustering basado en densidad y asignamos cada muestra a un cluster.

In [4]:
from sklearn.cluster import DBSCAN

# Initialize the DBSCAN model
model = DBSCAN(eps=0.5, min_samples=5)

# Fit the model and predict the clusters
clusters = model.fit_predict(X)

# Create a DataFrame for better visualization
df_clusters = pd.DataFrame(X, columns=data.feature_names)
df_clusters['Cluster'] = clusters

print("DBSCAN Clustering:")
print(df_clusters.head())


DBSCAN Clustering:
   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

   Cluster  
0        0  
1        0  
2        0  
3        0  
4        0  


In [None]:
## MeanShift
Entrenamos un modelo MeanShift para clustering basado en la estimación de la densidad y asignamos cada muestra a un cluster.

In [5]:
from sklearn.cluster import MeanShift

# Initialize the MeanShift model
model = MeanShift()

# Fit the model and predict the clusters
clusters = model.fit_predict(X)

# Create a DataFrame for better visualization
df_clusters = pd.DataFrame(X, columns=data.feature_names)
df_clusters['Cluster'] = clusters

print("MeanShift Clustering:")
print(df_clusters.head())


MeanShift Clustering:
   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

   Cluster  
0        1  
1        1  
2        1  
3        1  
4        1  
