<a href="https://colab.research.google.com/github/Andrespinedap/AlgoritmoNoSupervisadoM/blob/main/algoritmonosupervisado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sección nueva

In [None]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
import seaborn as sns

# 1. Carga de datos
# Para este ejemplo, utilizaremos el dataset de iris de Scikit-Learn
from sklearn.datasets import load_iris
data = load_iris()
df = pd.DataFrame(data.data, columns=data.feature_names)

# 2. Exploración básica de los datos
print("Primeras filas del conjunto de datos:")
print(df.head())
print("\nDescripción del conjunto de datos:")
print(df.describe())

# 3. Escalado de los datos
# Escalar los datos es importante para algoritmos basados en distancia como K-Means
scaler = StandardScaler()
scaled_data = scaler.fit_transform(df)

# 4. Reducción de dimensionalidad con PCA (para visualización)
# Reducimos a 2 componentes principales para poder visualizar los clústeres
pca = PCA(n_components=2)
pca_data = pca.fit_transform(scaled_data)
pca_df = pd.DataFrame(pca_data, columns=['PCA1', 'PCA2'])

# 5. Implementación del algoritmo K-Means
# Elegimos 3 clústeres (sabemos que el dataset de iris tiene 3 clases naturales)
kmeans = KMeans(n_clusters=3, random_state=42)
pca_df['Cluster'] = kmeans.fit_predict(scaled_data)

# 6. Visualización de los resultados
# Visualizamos los clústeres resultantes en las dos primeras componentes principales
plt.figure(figsize=(10, 6))
sns.scatterplot(x='PCA1', y='PCA2', hue='Cluster', data=pca_df, palette='viridis')
plt.title('Visualización de Clústeres usando K-Means con reducción PCA')
plt.xlabel('Componente Principal 1')
plt.ylabel('Componente Principal 2')
plt.legend(title='Clúster')
plt.show()

# 7. Interpretación de resultados
# Los puntos de colores diferentes representan distintos clústeres identificados por K-Means.
# Podemos observar cómo el algoritmo ha agrupado los datos en tres grupos, representados con diferentes colores.

# Nota sobre el uso del código:
# Este análisis implementa el algoritmo de clustering K-Means y muestra los resultados mediante reducción de dimensionalidad con PCA.
# La interpretación visual sugiere cómo el algoritmo ha segmentado los datos en diferentes clústeres.
