In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import MinMaxScaler
from kneed import KneeLocator

# Función para cargar y normalizar datos
def cargar_y_normalizar_datos(ruta_csv, columnas):
    datos = pd.read_csv(ruta_csv)
    scaler = MinMaxScaler()
    datos[columnas] = scaler.fit_transform(datos[columnas])
    return datos

# Función para calcular inercia
def calcular_inercia(data, max_k=10):
    inercia = []
    k_values = range(1, max_k + 1)
    for k in k_values:
        kmeans = KMeans(n_clusters=k, random_state=42, n_init=10)
        kmeans.fit(data)
        inercia.append(kmeans.inertia_)
    return k_values, inercia

# Función para detectar el codo


# Función para graficar Metodo Codo, sobre k=21 podemos decir que se estabiliza el metodo
def graficar_codo(k, inercia):
    plt.figure(figsize=(8, 5))
    plt.plot(k, inercia, marker='o', label='Inercia')

    plt.title('Método del Codo - Detección Analítica')
    plt.xlabel('Número de Clusters (k)')
    plt.ylabel('Inercia')
    plt.xticks(k)
    plt.legend()
    plt.grid(True)
    plt.show()

# Función principal
def main():
    ruta_csv = "kmeans2.csv"
    columnas = ['PAC_EDAD', 'SATO2', 'TEMPERATURA', 'GLASGOW', 'EVA', 'HGT', 'FR', 'DIAS_HOSP']
    
    # Cargar y normalizar datos
    datos = cargar_y_normalizar_datos(ruta_csv, columnas)
    
    # Calcular inercia
    max_k = 30
    k_values, inercia = calcular_inercia(datos[columnas], max_k)
    
    # Detectar el codo
    
    # Graficar el Método del Codo
    graficar_codo(k_values, inercia)
    
    # Reportar el número óptimo de clusters

if __name__ == "__main__":
    main()


In [None]:
# Re-import necessary libraries and reinitialize the environment
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
datos = pd.read_csv("kmeans2.csv")

 

# Seleccionar todas las columnas para cluster
X = datos

# Estandarizacion de registros
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Utilizando kmean
optimal_clusters = 20  # Basado en la interpretación típica del método del codo
kmeans_optimal = KMeans(n_clusters=optimal_clusters, random_state=42, n_init=25)
kmeans_optimal.fit(X_scaled)

# agrupar centroides y transformarlos inversamente a la escala original
centroids = scaler.inverse_transform(kmeans_optimal.cluster_centers_)
centroids_df = pd.DataFrame(centroids, columns=datos.columns)

 # Visualización de los centroides para su interpretación
display(centroids_df)
