In [1]:
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans, AffinityPropagation
from sklearn.metrics import silhouette_score
from tabulate import tabulate

# Carregar os dados
data = pd.read_csv('X_dataset.csv')
X = data.values

# Inicializando os modelos
kmeans = KMeans(
    n_clusters=3,
    init='k-means++',
    n_init=10,
    max_iter=300,
    tol=0.0001,
    verbose=0,
    random_state=None,
    copy_x=True,
    algorithm='lloyd'
)

# Treinando o modelo KMeans
kmeans.fit(X)
labels_kmeans = kmeans.labels_
silhouette_avg_kmeans = silhouette_score(X, labels_kmeans)

# Criar uma instância do AffinityPropagation
affinity_propagation = AffinityPropagation(
    damping=0.5,
    max_iter=200,
    convergence_iter=25,
    copy=True,
    preference=-50,
    affinity='euclidean',
    verbose=False
)

# Treinando o modelo AffinityPropagation
affinity_propagation.fit(X)
labels_ap = affinity_propagation.labels_
silhouette_avg_ap = silhouette_score(X, labels_ap)

# Armazenando os resultados em uma tabela
results = [
    ["KMeans", silhouette_avg_kmeans],
    ["AffinityPropagation", silhouette_avg_ap]
]

# Convertendo para DataFrame para melhor formatação
results_df = pd.DataFrame(results, columns=["Modelo", "Silhouette Score"])

# Mostrando os resultados em formato de tabela com divisórias
print(tabulate(results_df, headers='keys', tablefmt='grid'))


+----+---------------------+--------------------+
|    | Modelo              |   Silhouette Score |
|  0 | KMeans              |           0.233105 |
+----+---------------------+--------------------+
|  1 | AffinityPropagation |           0.202286 |
+----+---------------------+--------------------+
