In [None]:
import pandas as pd

# URL do dataset Wine
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

# Ler o arquivo CSV com as colunas especificadas, definindo a coluna 'classe' como object
vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

**1. Normalização dos Dados**

In [None]:
from sklearn.preprocessing import MinMaxScaler

# Dropar a coluna 'classe'
X = vinhos.drop('classe', axis=1)

# Reescala linear dos dados
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

In [None]:
# Converter o array NumPy de volta para um DataFrame pandas
X_scaled_df = pd.DataFrame(X_scaled, columns=X.columns)

# Concatenar a coluna 'classe' de volta ao DataFrame
vinhos_scaled = pd.concat([vinhos['classe'], X_scaled_df], axis=1)

# Exibir as primeiras linhas do DataFrame com os dados normalizados
print(vinhos_scaled.head())

**2. Aplicação do K-Means**

In [None]:
from sklearn.cluster import KMeans

# Aplicar K-Means com 4 clusters
kmeans = KMeans(n_clusters=4, random_state=42)
vinhos['cluster'] = kmeans.fit_predict(X_scaled)

# Apresentar o valor da inércia
print(f'Inércia do modelo K-Means: {kmeans.inertia_}')  # Exemplo de como apresentar a inércia

In [None]:
# Aplicar K-Means com 4 clusters
kmeans = KMeans(n_clusters=4, random_state=42)
vinhos['cluster'] = kmeans.fit_predict(X_scaled)

# Apresentar o valor da inércia
print(f'Inércia do modelo K-Means: {kmeans.inertia_}')

**3. Análise dos Clusters**

In [None]:
print(vinhos['cluster'].value_counts())

**4. Comparação com Classes Originais**

In [None]:
# Agrupar os dados por cluster e classe original e contar as ocorrências
cluster_comparison = vinhos.groupby(['cluster', 'classe']).size().unstack(fill_value=0)

# Exibir a comparação
cluster_comparison