# Modelos NO Supervisados

## Mapa del mundo del ML

![image.png](attachment:image.png)

## ML Clásico

![image.png](attachment:image.png)

## Algoritmos ML no supervisado disponibles en scikit-learn

| **Categoría**             | **Nombre**               | **Descripción**                                                                                     | **Casos de Uso**                                                                                   | **Referencia sklearn**                  | **URL**                                                                 |
|----------------------------|--------------------------|-----------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------|-----------------------------------------|-------------------------------------------------------------------------|
| **Clustering**             | **K-Means**              | Algoritmo de clustering que agrupa datos en k clústeres basados en la distancia euclidiana.        | Segmentación de clientes, compresión de imágenes, análisis de patrones.                            | `sklearn.cluster.KMeans`                | [KMeans](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html) |
|                            | **DBSCAN**               | Clustering basado en densidad que identifica regiones densas de puntos.                             | Detección de outliers, análisis espacial, datos con ruido.                                         | `sklearn.cluster.DBSCAN`                | [DBSCAN](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html) |
|                            | **Hierarchical Clustering** | Agrupa datos en una jerarquía de clústeres mediante un enfoque aglomerativo o divisivo.           | Biología (clasificación de especies), análisis de redes sociales.                                  | `sklearn.cluster.AgglomerativeClustering` | [AgglomerativeClustering](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html) |
|                            | **Gaussian Mixture Model (GMM)** | Modelo probabilístico que asume que los datos son generados por una mezcla de distribuciones gaussianas. | Segmentación suave, modelado de datos con incertidumbre.                                           | `sklearn.mixture.GaussianMixture`       | [GaussianMixture](https://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html) |
| **Association**            | **Apriori**              | Algoritmo de asociación que identifica conjuntos de elementos frecuentes en transacciones.          | Análisis de carritos de compra, recomendaciones de productos.                                      | No disponible directamente en sklearn   | [Referencia externa](https://en.wikipedia.org/wiki/Apriori_algorithm)   |
| **Dimensionality Reduction** | **Principal Component Analysis (PCA)** | Técnica de reducción de dimensionalidad que transforma los datos en componentes principales ortogonales. | Visualización de datos, eliminación de características redundantes, compresión de datos.           | `sklearn.decomposition.PCA`             | [PCA](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html) |
|                            | **t-SNE**                | Técnica de reducción de dimensionalidad no lineal para visualización de datos complejos.            | Visualización de alta dimensión, análisis exploratorio.                                            | `sklearn.manifold.TSNE`                 | [t-SNE](https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html)   |
|                            | **UMAP**                 | Técnica de reducción de dimensionalidad similar a t-SNE pero más rápida y escalable.                | Visualización de grandes volúmenes de datos, análisis exploratorio.                                | No disponible directamente en sklearn   | [UMAP](https://umap-learn.readthedocs.io/en/latest/)                    |
|                            | **Non-Negative Matrix Factorization (NMF)** | Descompone una matriz en factores no negativos para extraer patrones interpretables.             | Procesamiento de imágenes, análisis de texto, descomposición de señales.                           | `sklearn.decomposition.NMF`             | [NMF](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.NMF.html) |
|                            | **Latent Dirichlet Allocation (LDA)** | Modelo generativo probabilístico para descubrir temas latentes en documentos de texto.            | Modelado de temas en texto, análisis de opiniones, minería de texto.                               | `sklearn.decomposition.LatentDirichletAllocation` | [LDA](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.LatentDirichletAllocation.html) |

## Métricas para Algoritnos no supervisados

| **Nombre**                  | **Descripción**                                                                                     | **Algoritmos en los que se usa**                                                                 | **Valores Óptimos** | **Valores Buenos**       | **Valores Malos**        | **Valores Pésimos**      | **Referencia**                                                                 |
|-----------------------------|-----------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------|---------------------|--------------------------|--------------------------|--------------------------|--------------------------------------------------------------------------------|
| **Inercia (Inertia)**       | Suma de las distancias cuadradas entre cada punto y el centroide de su clúster.                    | K-Means                                                                                         | Bajo                | Moderado                 | Alto                     | Muy alto                 | [Inertia - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html) |
| **Silhouette Score**        | Mide qué tan similares son los puntos dentro de un clúster en comparación con otros clústeres.     | K-Means, DBSCAN, Hierarchical Clustering, Gaussian Mixture Model                                | Cercano a 1         | Entre 0.5 y 1            | Entre 0 y 0.5            | Cercano a 0 o negativo   | [Silhouette Score - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.silhouette_score.html) |
| **Davies-Bouldin Index**    | Evalúa la relación entre la dispersión dentro de los clústeres y la separación entre ellos.         | K-Means, Hierarchical Clustering                                                                | Cercano a 0         | Entre 0 y 1              | Entre 1 y 2              | Mayor a 2                | [Davies-Bouldin Index - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.davies_bouldin_score.html) |
| **Calinski-Harabasz Index** | Evalúa la relación entre la dispersión inter-clúster e intra-clúster.                               | K-Means, Hierarchical Clustering                                                                | Alto                | Moderado                 | Bajo                     | Muy bajo                 | [Calinski-Harabasz Index - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.calinski_harabasz_score.html) |
| **Log-Verosimilitud**       | Evalúa la probabilidad de los datos bajo el modelo probabilístico.                                  | Gaussian Mixture Model                                                                          | Alto                | Moderado                 | Bajo                     | Muy bajo                 | [Log-Likelihood - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html#sklearn.mixture.GaussianMixture.score) |
| **Varianza Explicada**      | Proporción de la varianza total capturada por los componentes principales.                          | Principal Component Analysis (PCA)                                                              | Cercano a 1         | Entre 0.7 y 1            | Entre 0.5 y 0.7          | Menor a 0.5              | [Explained Variance - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html#sklearn.decomposition.PCA.explained_variance_ratio_) |
| **Reconstrucción Error**    | Diferencia entre los datos originales y los datos reconstruidos a partir de factores descompuestos. | Non-Negative Matrix Factorization (NMF)                                                         | Bajo                | Moderado                 | Alto                     | Muy alto                 | [Reconstruction Error - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.NMF.html#sklearn.decomposition.NMF.reconstruction_err_) |
| **Lift**                    | Mide cuánto más probable es que un conjunto de elementos ocurra juntos en comparación con el azar.  | Apriori                                                                                         | Mayor a 1           | Entre 1 y 1.5            | Entre 0.5 y 1            | Menor a 0.5              | [Lift - mlxtend](https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/association_rules/) |
| **Support**                 | Frecuencia relativa con la que aparece un conjunto de elementos en el dataset.                      | Apriori                                                                                         | Alto                | Moderado                 | Bajo                     | Muy bajo                 | [Support - mlxtend](https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/apriori/)           |
| **Confidence**              | Probabilidad condicional de que si un conjunto de elementos ocurre, otro también ocurra.            | Apriori                                                                                         | Cercano a 1         | Entre 0.7 y 1            | Entre 0.3 y 0.7          | Menor a 0.3              | [Confidence - mlxtend](https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/association_rules/) |
| **Perplejidad (Perplexity)**| Mide qué tan bien el modelo predice un conjunto de datos (cuanto menor, mejor).                     | Latent Dirichlet Allocation (LDA)                                                               | Bajo                | Moderado                 | Alto                     | Muy alto                 | [Perplexity - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.LatentDirichletAllocation.html#sklearn.decomposition.LatentDirichletAllocation.perplexity) |
| **Visualización (t-SNE/UMAP)** | Evalúa la calidad de la representación visual reducida en 2D o 3D.                                 | t-SNE, UMAP                                                                                     | Separación clara entre grupos | Grupos parcialmente separados | Grupos solapados          | Grupos completamente mezclados | [t-SNE - scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html) <br> [UMAP - umap-learn](https://umap-learn.readthedocs.io/en/latest/) |

## Resumen de Hiperparámetros

| **Algoritmo**                     | **Hiperparámetro**                  | **Descripción**                                                                                     | **Valores Típicos**                                                                 |
|-----------------------------------|-------------------------------------|-----------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------|
| **K-Means**                       | `n_clusters`                       | Número de clústeres a formar.                                                                       | Entero positivo (por ejemplo, 2, 3, 5, 10).                                         |
|                                   | `init`                             | Método de inicialización de los centroides.                                                         | `'k-means++'`, `'random'`.                                                          |
|                                   | `max_iter`                         | Número máximo de iteraciones para converger.                                                        | Entero positivo (por ejemplo, 100, 300).                                            |
|                                   | `random_state`                     | Semilla para reproducibilidad.                                                                      | Entero positivo o `None`.                                                           |
| **DBSCAN**                        | `eps`                              | Radio máximo de vecindad para considerar puntos como vecinos.                                       | Flotante positivo (por ejemplo, 0.1, 0.5, 1.0).                                     |
|                                   | `min_samples`                      | Número mínimo de puntos en una vecindad para formar un clúster.                                     | Entero positivo (por ejemplo, 2, 5, 10).                                            |
|                                   | `metric`                           | Métrica de distancia utilizada para calcular la cercanía entre puntos.                              | `'euclidean'`, `'manhattan'`, `'cosine'`.                                           |
| **Hierarchical Clustering**       | `n_clusters`                       | Número de clústeres finales.                                                                        | Entero positivo (por ejemplo, 2, 3, 5).                                             |
|                                   | `affinity`                         | Métrica de distancia utilizada para calcular la similitud entre puntos.                             | `'euclidean'`, `'manhattan'`, `'cosine'`.                                           |
|                                   | `linkage`                          | Método para combinar clústeres en clustering jerárquico.                                            | `'ward'`, `'complete'`, `'average'`, `'single'`.                                    |
| **Gaussian Mixture Model (GMM)**  | `n_components`                     | Número de componentes (distribuciones gaussianas) en la mezcla.                                      | Entero positivo (por ejemplo, 2, 3, 5).                                             |
|                                   | `covariance_type`                  | Tipo de matriz de covarianza para las distribuciones gaussianas.                                     | `'full'`, `'tied'`, `'diag'`, `'spherical'`.                                        |
|                                   | `random_state`                     | Semilla para reproducibilidad.                                                                      | Entero positivo o `None`.                                                           |
| **Principal Component Analysis (PCA)** | `n_components`                 | Número de componentes principales a conservar.                                                      | Entero positivo o flotante (por ejemplo, 2, 0.95 para varianza explicada).          |
|                                   | `svd_solver`                       | Método computacional para realizar la descomposición SVD.                                           | `'auto'`, `'full'`, `'arpack'`, `'randomized'`.                                     |
| **t-SNE**                         | `n_components`                     | Número de dimensiones del espacio reducido.                                                         | Entero positivo (por ejemplo, 2, 3).                                                |
|                                   | `perplexity`                       | Balance entre estructura local y global en los datos.                                               | Flotante positivo (por ejemplo, 5, 30, 50).                                         |
|                                   | `learning_rate`                    | Tasa de aprendizaje para optimizar la distribución de los puntos.                                   | Flotante positivo (por ejemplo, 10, 200, 1000).                                     |
| **UMAP**                          | `n_components`                     | Número de dimensiones del espacio reducido.                                                         | Entero positivo (por ejemplo, 2, 3).                                                |
|                                   | `n_neighbors`                      | Número de vecinos considerados para preservar la estructura local.                                  | Entero positivo (por ejemplo, 5, 10, 30).                                           |
|                                   | `min_dist`                         | Distancia mínima entre puntos en el espacio reducido.                                               | Flotante positivo (por ejemplo, 0.1, 0.5).                                          |
| **Non-Negative Matrix Factorization (NMF)** | `n_components`             | Número de componentes no negativos en la descomposición.                                            | Entero positivo (por ejemplo, 2, 5, 10).                                            |
|                                   | `init`                             | Método de inicialización de los factores.                                                           | `'random'`, `'nndsvd'`, `'nndsvda'`, `'nndsvdar'`.                                  |
|                                   | `solver`                           | Algoritmo utilizado para resolver la descomposición.                                                | `'cd'` (coordenadas descendentes), `'mu'` (multiplicative update).                   |
| **Latent Dirichlet Allocation (LDA)** | `n_components`                 | Número de temas latentes a descubrir.                                                               | Entero positivo (por ejemplo, 5, 10, 20).                                           |
|                                   | `learning_method`                  | Método de aprendizaje para estimar los parámetros del modelo.                                       | `'batch'`, `'online'`.                                                              |
|                                   | `random_state`                     | Semilla para reproducibilidad.                                                                      | Entero positivo o `None`.                                                           |
| **Apriori**                       | `min_support`                      | Umbral mínimo de soporte para considerar un conjunto de elementos frecuente.                        | Flotante entre 0 y 1 (por ejemplo, 0.1, 0.5).                                       |