<a href="https://colab.research.google.com/github/pisceno/algoritmos/blob/master/Wine.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Importar librerías necesarias
import pandas as pd
import numpy as np

# Cargar el dataset
url = "https://raw.githubusercontent.com/juarezefren/datasets/refs/heads/main/Examen%20Mes2/wineQuality_noClass.csv"
dfOriginal = pd.read_csv(url)

# Mostrar las primeras filas del dataset para entender su estructura
print(dfOriginal.head())

# 1. Tratamiento de Valores Nulos
# Revisar si existen valores nulos
null_values = dfOriginal.isnull().sum()
print("Valores nulos en cada columna:\n", null_values)

# Imputar valores nulos (usaremos la media en este ejemplo)
dfOriginal.fillna(dfOriginal.mean(), inplace=True)

# Verificar si aún existen valores nulos después de la imputación
null_values_after_imputation = dfOriginal.isnull().sum()
print("Valores nulos después de la imputación:\n", null_values_after_imputation)

# 2. Conversión de Variables Categóricas
# Revisar si existen variables categóricas
categorical_columns = dfOriginal.select_dtypes(include=['object']).columns
print("Columnas categóricas:\n", categorical_columns)

# Convertir variables categóricas en numéricas (usaremos One-Hot Encoding en este ejemplo)
dfTratado = pd.get_dummies(dfOriginal, columns=categorical_columns)

# 3. Guardar el dataset preprocesado en una variable dfTratado
print("Dataset preprocesado:\n", dfTratado.head())

# Mostrar las primeras filas del dataset tratado
print("Columnas del dataset tratado:\n", dfTratado.columns)


import matplotlib.pyplot as plt
from sklearn.cluster import KMeans

# Determinación del número de clusters usando el método del codo
sse = []
k_range = range(2, 21)
for k in k_range:
    kmeans = KMeans(n_clusters=k, random_state=42)
    kmeans.fit(dfTratado)
    sse.append(kmeans.inertia_)

# Graficar el método del codo
plt.figure(figsize=(10,6))
plt.plot(k_range, sse, marker='o')
plt.xlabel('Número de Clusters (K)')
plt.ylabel('SSE')
plt.title('Método del Codo para Determinar el Número Óptimo de Clusters')
plt.show()


# Aplicar K-means con el número óptimo de clusters (K)
optimal_k = 6  # Ajustar según el resultado del método del codo
kmeans = KMeans(n_clusters=optimal_k, random_state=42)
kmeansLabels = kmeans.fit_predict(dfTratado)
dfTratado['Kmeans_Labels'] = kmeansLabels

from sklearn.cluster import AgglomerativeClustering

# Aplicar Clustering Jerárquico Aglomerativo con el número óptimo de clusters (K)
agg_clustering = AgglomerativeClustering(n_clusters=optimal_k)
aglomerativeLabels = agg_clustering.fit_predict(dfTratado)
dfTratado['Aglomerative_Labels'] = aglomerativeLabels



from sklearn.metrics import adjusted_rand_score

# Cargar el dataset de categorías de calidad esperadas
url_quality = "https://raw.githubusercontent.com/juarezefren/datasets/refs/heads/main/Examen%20Mes2/wineQuality_Class.csv"
yLabels = pd.read_csv(url_quality)['quality']

# Calcular el ARI para cada método de clustering
ari_kmeans = adjusted_rand_score(yLabels, kmeansLabels)
ari_agglomerative = adjusted_rand_score(yLabels, aglomerativeLabels)

print(f"ARI para K-means: {ari_kmeans}")
print(f"ARI para Clustering Jerárquico Aglomerativo: {ari_agglomerative}")


# Gráficos de Dispersión 2D
plt.figure(figsize=(15,5))

# K-means
plt.subplot(1, 3, 1)
plt.scatter(dfTratado['sulphates'], dfTratado['volatile acidity'], c=dfTratado['Kmeans_Labels'])
plt.xlabel('Sulphates')
plt.ylabel('Volatile Acidity')
plt.title('Clusters por K-means')

# Clustering Jerárquico
plt.subplot(1, 3, 2)
plt.scatter(dfTratado['sulphates'], dfTratado['volatile acidity'], c=dfTratado['Aglomerative_Labels'])
plt.xlabel('Sulphates')
plt.ylabel('Volatile Acidity')
plt.title('Clusters por Clustering Jerárquico')

# Categorías de Calidad
plt.subplot(1, 3, 3)
plt.scatter(dfTratado['sulphates'], dfTratado['volatile acidity'], c=yLabels)
plt.xlabel('Sulphates')
plt.ylabel('Volatile Acidity')
plt.title('Categorías de Calidad Reales')

plt.show()



plt.figure(figsize=(15,5))

# K-means
plt.subplot(1, 3, 1)
plt.scatter(dfTratado['citric acid'], dfTratado['residual sugar'], c=dfTratado['Kmeans_Labels'])
plt.xlabel('Citric Acid')
plt.ylabel('Residual Sugar')
plt.title('Clusters por K-means')

# Clustering Jerárquico
plt.subplot(1, 3, 2)
plt.scatter(dfTratado['citric acid'], dfTratado['residual sugar'], c=dfTratado['Aglomerative_Labels'])
plt.xlabel('Citric Acid')
plt.ylabel('Residual Sugar')
plt.title('Clusters por Clustering Jerárquico')

# Categorías de Calidad
plt.subplot(1, 3, 3)
plt.scatter(dfTratado['citric acid'], dfTratado['residual sugar'], c=yLabels)
plt.xlabel('Citric Acid')
plt.ylabel('Residual Sugar')
plt.title('Categorías de Calidad Reales')

plt.show()

   fixed acidity  volatile acidity  citric acid alcohol_category  \
0            7.4              0.70         0.00         Muy Bajo   
1            7.8              0.88         0.00             Bajo   
2            7.8              0.76         0.04             Bajo   
3           11.2              0.28         0.56             Bajo   
4            7.4              0.70         0.00         Muy Bajo   

   residual sugar  chlorides  free sulfur dioxide  total sulfur dioxide  \
0             1.9      0.076                 11.0                  34.0   
1             2.6      0.098                 25.0                  67.0   
2             2.3        NaN                 15.0                  54.0   
3             1.9      0.075                 17.0                  60.0   
4             1.9      0.076                 11.0                  34.0   

   density    pH  sulphates  
0   0.9978  3.51       0.56  
1   0.9968  3.20       0.68  
2   0.9970  3.26       0.65  
3   0.9980  3.16    

TypeError: Could not convert ['Muy BajoBajoBajoBajoMuy BajoMuy BajoMuy BajoMedioMuy BajoMedioMuy BajoMedioBajoMuy BajoMuy BajoMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoBajoMuy BajoMuy BajoBajoMuy BajoMuy BajoMuy BajoMuy BajoBajoMedioAltoBajoMuy BajoMuy BajoBajoAltoBajoBajoMedioMedioMuy BajoMedioMedioMuy BajoMuy AltoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMuy BajoBajoMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoBajoAltoAltoBajoAltoAltoMedioMuy BajoMuy BajoMuy BajoMuy BajoBajoMedioMedioAltoMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMedioBajoBajoMuy BajoMuy BajoMuy BajoBajoBajoBajoMedioMuy AltoAltoMuy BajoBajoMuy BajoMedioMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoBajoMuy BajoMuy BajoBajoBajoBajoMuy BajoMedioMedioMuy BajoAltoMuy BajoMuy BajoAltoMuy BajoMuy BajoMuy BajoMuy BajoAltoAltoMedioMuy BajoMuy BajoMuy AltoMuy AltoBajoBajoBajoMuy BajoMuy BajoMuy BajoMuy BajoBajoMuy BajoMuy AltoMuy BajoMuy AltoMuy BajoMedioMuy BajoMedioMedioMedioMuy BajoMedioMedioMedioMedioMedioMedioMuy BajoMuy BajoBajoMuy BajoMedioMuy BajoMuy BajoMuy BajoMedioMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy AltoMuy BajoMuy BajoMuy BajoMedioBajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoBajoMuy BajoBajoMuy BajoMuy BajoMuy BajoBajoMuy BajoBajoBajoMuy BajoMedioMedioMuy AltoMuy AltoMedioMuy BajoMuy BajoMuy BajoMuy BajoAltoAltoMuy BajoMuy BajoMedioMuy AltoMedioMedioMedioBajoMedioAltoMuy BajoBajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMedioMedioMuy BajoBajoMedioAltoMuy AltoBajoBajoAltoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoAltoBajoMuy BajoMuy BajoBajoMuy BajoMuy BajoBajoBajoMedioBajoMedioMuy BajoBajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMuy BajoMuy BajoMedioMuy BajoAltoMedioBajoMuy AltoMuy BajoMedioAltoMedioMedioMuy BajoMuy BajoAltoMuy BajoMedioMuy AltoMedioMuy BajoBajoMuy BajoMedioBajoBajoMedioMedioAltoMuy BajoAltoMedioMedioMedioMuy BajoMuy BajoBajoBajoBajoBajoAltoMedioMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoAltoAltoMedioMedioMuy AltoMedioMuy AltoBajoMuy BajoMuy BajoMuy BajoMuy BajoMuy AltoMuy AltoBajoMuy BajoMuy AltoMuy AltoMuy BajoAltoMuy AltoMuy AltoMuy AltoMedioMuy AltoBajoMuy BajoAltoBajoBajoAltoBajoMuy AltoMuy AltoMedioMuy BajoBajoMuy BajoMuy BajoMuy AltoMuy AltoMuy AltoAltoMuy AltoMedioBajoMuy BajoBajoMedioMedioMedioMuy AltoMedioMuy BajoMuy BajoMuy AltoBajoMuy BajoAltoMuy BajoAltoMuy AltoAltoMuy AltoMuy AltoAltoMuy BajoMedioMuy BajoMuy BajoMuy BajoBajoMuy BajoBajoMuy BajoMedioMuy AltoMedioMuy BajoMuy BajoBajoMuy AltoBajoAltoAltoMuy BajoBajoAltoMedioMedioMuy BajoMedioAltoAltoAltoBajoMuy BajoMuy BajoMuy BajoMuy AltoMuy BajoMuy BajoMuy AltoMedioMedioBajoMuy AltoMuy AltoAltoAltoAltoMuy AltoMuy AltoAltoMuy BajoMedioAltoMuy BajoMuy AltoMuy BajoBajoMuy BajoMedioAltoBajoMuy BajoBajoAltoAltoMuy AltoMuy AltoMedioMedioAltoMedioAltoAltoMuy BajoMedioAltoAltoMuy AltoMedioBajoAltoMuy BajoAltoMuy BajoMuy AltoMuy BajoMuy BajoBajoMuy AltoMuy AltoMuy BajoBajoAltoMuy AltoMedioAltoMuy BajoMedioBajoAltoMedioMedioMuy BajoMuy AltoMuy BajoMuy BajoMuy AltoMedioMedioMedioAltoMedioAltoMuy AltoMuy AltoMuy AltoMuy AltoAltoMuy BajoAltoAltoMuy AltoMuy BajoMuy AltoMuy AltoAltoAltoMuy AltoAltoMuy BajoMedioMuy AltoMuy BajoMedioBajoMuy AltoMuy AltoMuy BajoMuy AltoMuy BajoMuy AltoAltoMedioMuy BajoBajoMuy BajoMuy BajoBajoAltoMuy AltoMuy BajoMuy BajoMedioMedioMedioMuy AltoMedioMedioMuy BajoAltoMuy AltoAltoBajoAltoBajoAltoMuy BajoMuy BajoMuy BajoAltoMedioMuy BajoMuy BajoMedioMedioMuy AltoAltoAltoMuy AltoAltoMuy AltoMuy AltoMuy AltoMuy BajoMuy BajoMedioMuy AltoMuy AltoMuy BajoMuy BajoAltoMuy AltoAltoMuy AltoMedioBajoMedioMedioMedioMuy BajoBajoBajoBajoBajoMuy BajoBajoAltoBajoAltoMuy BajoMuy AltoMedioBajoMuy AltoBajoMuy BajoMuy BajoMuy BajoMuy BajoMedioBajoMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy AltoMedioMedioMuy AltoMuy BajoMuy BajoMedioBajoMedioBajoBajoBajoMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy AltoMedioMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMedioAltoMuy BajoBajoMuy BajoMuy BajoMedioMedioMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMedioAltoAltoAltoBajoAltoMuy AltoMuy AltoMuy BajoMuy BajoBajoMedioBajoAltoBajoMuy BajoBajoMedioMedioBajoMuy BajoMuy BajoAltoMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoMedioMuy BajoBajoMedioBajoMuy BajoMedioBajoAltoMuy BajoAltoMuy BajoBajoMuy BajoMuy BajoAltoBajoMuy BajoMuy BajoMuy BajoMuy AltoMuy BajoMuy BajoBajoAltoMedioMuy BajoMuy BajoBajoBajoBajoMedioMedioMuy AltoMedioMedioMuy BajoMuy BajoMuy BajoBajoMuy BajoMuy BajoMedioBajoMuy BajoBajoMuy BajoMedioMuy BajoAltoMedioAltoMuy BajoMuy BajoMuy AltoBajoMuy AltoBajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy AltoMuy BajoMuy BajoMedioMuy BajoMuy BajoMuy BajoMuy BajoBajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoAltoAltoBajoBajoMuy BajoBajoBajoMedioBajoMuy BajoMuy BajoMuy BajoMuy BajoBajoBajoBajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMedioMedioMedioBajoMuy BajoBajoMedioBajoBajoMuy BajoMuy BajoMedioMedioMuy BajoBajoBajoBajoAltoMuy AltoMedioBajoAltoAltoAltoMuy BajoMedioMuy AltoBajoBajoMuy AltoMuy AltoMuy AltoMuy BajoMedioMedioAltoAltoMuy AltoAltoAltoMedioMuy AltoMuy BajoBajoBajoMuy AltoBajoBajoMedioAltoAltoAltoMuy AltoAltoAltoAltoBajoBajoMuy BajoMuy BajoMuy AltoMuy AltoAltoMedioMuy AltoMedioAltoMuy BajoAltoBajoBajoBajoBajoBajoMuy BajoMuy BajoBajoAltoAltoMuy AltoAltoAltoAltoAltoMuy BajoMuy AltoMedioBajoMuy BajoBajoAltoAltoAltoAltoMuy AltoAltoMedioAltoMuy AltoMuy AltoAltoMuy AltoMedioMuy BajoBajoMuy AltoMuy AltoMuy BajoMedioMedioMedioMuy AltoAltoMuy BajoMedioBajoMuy BajoBajoBajoAltoMuy AltoAltoMuy AltoAltoMuy AltoAltoAltoAltoAltoMuy BajoAltoMuy AltoAltoMuy AltoMuy AltoAltoMuy AltoMuy AltoMuy AltoMuy AltoAltoMedioAltoMuy AltoMedioAltoMuy AltoMedioAltoAltoMedioMuy BajoAltoMuy AltoMedioBajoMuy BajoBajoMedioMuy AltoMuy AltoMedioMuy AltoMuy AltoMuy AltoMuy AltoMedioBajoMuy AltoAltoMuy AltoMuy AltoMuy AltoMuy AltoMuy AltoMuy AltoAltoMuy AltoMuy AltoMedioAltoAltoAltoMedioAltoMuy BajoMuy BajoAltoAltoAltoMuy AltoMuy BajoMuy AltoMedioAltoAltoMuy AltoAltoMuy AltoMuy BajoMuy BajoMuy BajoAltoMedioMedioMedioMuy AltoMedioMedioAltoMuy AltoMuy BajoMuy BajoAltoMuy BajoMuy BajoMuy BajoMuy BajoMuy BajoMedioMuy AltoMuy AltoMuy BajoMuy AltoMuy AltoAltoMuy AltoMuy AltoMedioMuy AltoMuy AltoMuy AltoMuy AltoAltoMuy AltoMedioMedioMedioAltoMuy AltoMuy AltoMuy AltoMuy AltoMedioMuy AltoMuy AltoMedioMuy AltoMedioMedioMuy AltoMuy AltoMedioMedioMuy AltoAltoBajoMedioBajoAltoMuy AltoMuy BajoMuy AltoAltoMedioBajoAltoAltoMuy AltoMuy AltoAltoMedioAltoAltoMedioMuy BajoMuy AltoMuy AltoMuy BajoMuy BajoMuy AltoMuy BajoMuy AltoMuy AltoBajoMuy AltoMuy AltoMuy AltoMuy AltoMedioMuy AltoAltoAltoAltoAltoMuy BajoMuy BajoAltoMuy BajoMedioMuy AltoAltoAltoMuy AltoMuy AltoMuy AltoMuy BajoMuy AltoMuy BajoBajoMuy AltoAltoBajoBajoMuy AltoMuy AltoMuy AltoMuy AltoAltoMedioAltoMuy BajoMuy AltoMuy BajoMuy AltoMuy AltoAltoMuy AltoMuy AltoMuy AltoMuy AltoMuy AltoMuy BajoAltoMedioMuy AltoAltoMuy BajoMuy AltoAltoAltoAltoMuy AltoMuy AltoMuy AltoMuy AltoMuy AltoAltoMuy AltoAltoMuy AltoMuy AltoMedioMedioMedioMuy BajoMuy AltoAltoMuy AltoMuy AltoMuy AltoMuy AltoMuy BajoMuy BajoMuy BajoAltoMuy AltoMedioMedioMedioBajoMuy AltoMuy AltoMuy AltoMuy AltoMuy AltoBajoAltoMuy AltoBajoMuy AltoMuy AltoAltoAltoAltoMedioMuy AltoMedioMedioMuy BajoMedioMuy AltoMuy AltoMuy AltoMedioAltoMuy AltoMuy BajoMuy BajoMuy AltoAltoMuy AltoMuy AltoAltoAltoMuy AltoMedioMuy BajoAltoMuy AltoMuy AltoMuy AltoAltoBajoMuy AltoAltoMuy AltoAltoMuy BajoMuy BajoMuy BajoBajoAltoMuy BajoBajoAltoMuy AltoMuy BajoAltoAltoAltoMedioAltoAltoMedioMuy BajoMedioMedioMedioAltoMuy BajoMuy AltoAltoAltoMuy AltoMuy AltoBajoMuy AltoMedioMuy BajoMuy BajoBajoMuy AltoMuy BajoMuy AltoAltoMuy BajoMuy BajoMuy AltoMuy AltoMuy BajoMuy AltoBajoMuy AltoMuy BajoBajoMuy AltoMuy BajoMedioMedioMedioMedioAltoAltoAltoBajoBajoMuy BajoAltoAltoMuy BajoAltoAltoAltoMuy BajoAltoBajoBajoMuy AltoMedioMedioMuy AltoMuy BajoMuy AltoMuy AltoMuy AltoAltoMuy BajoAltoMuy BajoMuy AltoBajoMuy BajoMuy AltoMedioMedioAltoMedioAltoMedioMuy AltoMuy AltoMedioMedioAltoAltoMuy AltoBajoAltoMuy BajoMuy BajoMuy AltoMuy AltoAltoMuy AltoMuy AltoAltoAltoMuy BajoBajoMedioAltoMedioMuy BajoBajoMuy AltoMedioMedioMedioBajoMuy AltoMuy AltoBajoMuy BajoMedioMuy AltoMuy AltoAltoAltoAltoAltoAltoMuy BajoBajoBajoMuy BajoBajoBajoMedioMuy AltoMuy BajoMuy BajoMuy BajoMedioMedioMedioMedioMedioAltoMedioMuy AltoMuy BajoMuy BajoAltoMedioMuy AltoMedioMedioMedioMedioMedioAltoMuy BajoMedioAltoMedioMedioBajoMuy AltoMuy BajoBajoMedioBajoMedioMuy BajoMuy AltoMuy BajoMuy BajoBajoBajoMedioMuy AltoBajoAltoAltoBajoBajoBajoMuy BajoMuy BajoBajoBajoMedioBajoMuy AltoAltoBajoMedioMuy BajoBajoBajoBajoMedioAltoBajoBajoMuy AltoMedioAltoAltoAltoAltoMuy AltoAltoMuy AltoAltoAltoMedioBajoMuy BajoBajoMuy AltoBajoBajoBajoMuy BajoMuy AltoAltoBajoBajoMuy AltoAltoAltoAltoMedioBajoMuy AltoMedioMuy BajoMuy BajoMuy BajoAltoMedioAltoAltoBajoBajoMuy AltoAltoBajoBajoBajoBajoAltoAltoAltoMuy AltoMuy BajoAltoAltoAltoMuy BajoMedioMuy AltoMedioMedioMedioAltoBajoBajoMedioAltoMedioBajoBajoMuy AltoAltoAltoMuy BajoMuy AltoMuy BajoMuy AltoMedioAltoMedioAltoMedioAltoAltoBajoMedioAltoMuy AltoAltoMuy AltoMuy AltoMuy AltoBajoMedioAltoBajoMuy AltoAltoMuy AltoBajoMuy BajoBajoAltoMuy AltoMedioAltoMuy AltoAltoAltoBajoBajoMedioMedioMuy BajoMuy BajoAltoMedioMedioMedioMedioMuy BajoAltoMedioMedioBajoBajoAltoMedioMedioAltoMedioBajoMuy BajoMuy AltoBajoMedioMedioMuy AltoBajoMuy AltoAltoAltoMedioAltoMedioMedioMuy AltoMedioMuy AltoMuy BajoMuy BajoAltoMuy BajoAltoAltoBajoAltoMuy BajoBajoBajoBajoMedioMedioMedioAltoAltoMedioMuy BajoMuy AltoMuy AltoAltoMuy BajoMuy AltoMedioMuy AltoAltoMuy AltoAltoAltoMuy AltoAltoMuy AltoBajoMuy AltoMuy AltoMuy AltoAltoMuy AltoMuy BajoMuy AltoMuy AltoAltoMuy BajoMedioAltoAltoMedioAlto'] to numeric