# MACHINE LEARNING NO SUPERVISADO
## Introducción a los Modelos No Supervisados

### Definiciones Preliminares del Capítulo

Aca debemos generar una lista de definiciones de conceptos técnicos y no técnicos que utilizaremos con frecuencia dentro del capitulo, con el objetivo de que el alumno no esté perdido.

* aprendizaje Automático
* datos no etiquetados


***Definición Modelo No Supervisado***

Un modelo no supervisado es un enfoque del aprendizaje automático que se utiliza para **descubrir patrones, estructuras y relaciones ocultas en conjuntos de datos no etiquetados**. A diferencia de los modelos supervisados que requieren etiquetas para entrenar y predecir, los modelos no supervisados se basan únicamente en las características intrínsecas de los datos para realizar tareas como el agrupamiento, la reducción de dimensionalidad y la detección de anomalías.



### Modelos No Supervisados Hoy en Día

***Desarrollo Reciente***

En las últimas décadas, ha habido un desarrollo significativo en el campo de los modelos no supervisados. Esto se ha impulsado principalmente por el aumento de la disponibilidad de grandes volúmenes de datos no etiquetados y los avances en técnicas de aprendizaje automático. Algunos de los desarrollos más destacados incluyen:
* Algoritmos de agrupamiento mejorados: Se han desarrollado algoritmos más sofisticados y eficientes para el agrupamiento de datos. Ejemplos incluyen el algoritmo de k-medias mejorado con inicializaciones inteligentes y métodos de agrupamiento jerárquico.

* Técnicas de reducción de dimensionalidad: La reducción de dimensionalidad se ha vuelto cada vez más importante con el crecimiento de los conjuntos de datos de alta dimensión. Técnicas como el análisis de componentes principales (PCA) y el t-SNE (t-distributed stochastic neighbor embedding) han mejorado en términos de eficiencia y capacidad para preservar la estructura de los datos.

* Aprendizaje profundo no supervisado: El desarrollo de modelos de aprendizaje profundo no supervisado, como las redes neuronales autoencoder y las redes generativas adversarias (GAN), ha permitido aprender representaciones más complejas y capturar características latentes en los datos.

* Avances en la detección de anomalías: Se han desarrollado técnicas más efectivas para la detección de anomalías en conjuntos de datos. Estas técnicas utilizan métodos como el análisis de valores atípicos, modelos generativos y técnicas de aprendizaje semi-supervisado para identificar patrones inusuales o comportamientos anómalos.

***Aplicaciones al Mundo Real***

Los modelos no supervisados han experimentado un desarrollo significativo en las últimas décadas gracias al aumento de datos no etiquetados y los avances en técnicas de aprendizaje automático. Han encontrado aplicaciones amplias en diversas áreas de las ciencias y el mundo empresarial, desempeñando un papel crucial en la extracción de conocimientos y la toma de decisiones informadas a partir de datos no etiquetados. Algunas de las áreas donde los modelos no supervisados se utilizan ampliamente incluyen:
* Ciencias de datos: Los modelos no supervisados desempeñan un papel crucial en la exploración y el análisis de grandes conjuntos de datos no etiquetados. Ayudan a identificar relaciones y patrones ocultos que pueden ser utilizados para obtener conocimientos y tomar decisiones informadas.

* Medicina: En el campo de la medicina, los modelos no supervisados se utilizan para el análisis de imágenes médicas, la detección de enfermedades y la identificación de patrones en grandes bases de datos de pacientes.

* Finanzas: Los modelos no supervisados son utilizados para el análisis de datos financieros, la detección de fraudes, la identificación de patrones en los mercados y la gestión de riesgos.

* Marketing y recomendaciones: Los modelos no supervisados se utilizan para el análisis de datos de clientes, la segmentación de mercado, la personalización de la experiencia del usuario y la generación de recomendaciones basadas en el comportamiento del usuario.




### Modelos Supervisados vs No Supervisados
Los modelos no supervisados difieren de los modelos supervisados en varios aspectos que repasaremos en detalle.

***Datos no etiquetados***

Los modelos no supervisados trabajan con datos no etiquetados, lo que significa que no se les proporciona información explícita sobre las salidas o categorías esperadas.
Dado un conjunto de datos de entrenamiento X y sus respectivas etiquetas Y, un modelo supervisado busca aprender una función f(X) = Y que mapee las características de entrada X a las etiquetas conocidas Y. En términos de fórmulas, se puede expresar como:
Y = f(X)

Dado un conjunto de datos de entrenamiento X, un modelo no supervisado busca aprender una representación latente Z de los datos o encontrar agrupamientos o relaciones entre las muestras en X. En términos de fórmulas, se puede expresar como:
Z = g(X) o Z = h(X)

Donde Z es la representación latente o los agrupamientos descubiertos, y g(X) o h(X) son funciones que realizan la transformación de los datos X.

***Aprendizaje no orientado***

El aprendizaje no orientado es una característica fundamental de los modelos no supervisados. A diferencia de los modelos supervisados, que tienen una orientación específica hacia la predicción de etiquetas o categorías conocidas, los modelos no supervisados no reciben ninguna guía o información explícita sobre las salidas esperadas.

En lugar de buscar una relación entre las características de entrada y las etiquetas conocidas, los modelos no supervisados se centran en descubrir patrones subyacentes, estructuras o características latentes en los datos no etiquetados. Estos patrones pueden manifestarse en forma de agrupamientos, similitudes, anomalías o representaciones más compactas de los datos.

La tarea principal de un modelo no supervisado es aprender una representación interna del conjunto de datos que capture las relaciones relevantes entre las variables o muestras. Esto se logra a través de algoritmos y técnicas diseñados para buscar regularidades, redundancias o características comunes en los datos sin necesidad de una guía externa.

Al no tener una orientación específica, los modelos no supervisados son más flexibles y pueden descubrir información inesperada o desconocida en los datos. Esto los hace especialmente útiles en situaciones donde las etiquetas pueden ser costosas o difíciles de obtener, o cuando se desconoce la estructura subyacente del conjunto de datos.

***Evaluación más subjetiva***

La evaluación de los modelos no supervisados a menudo implica un componente subjetivo debido a la falta de etiquetas o respuestas previas para comparar con los resultados obtenidos. A diferencia de los modelos supervisados, donde la precisión y el error se pueden medir objetivamente en función de las etiquetas conocidas, la evaluación de los modelos no supervisados es más subjetiva y puede depender de la interpretación del usuario.

Aquí hay algunas razones por las que la evaluación de los modelos no supervisados puede tener un componente subjetivo:
* Falta de respuestas previas: En los modelos no supervisados, no se proporcionan etiquetas o respuestas conocidas durante el entrenamiento. Esto dificulta la evaluación objetiva de la precisión o el rendimiento del modelo en términos de predicciones específicas.

* Métricas de evaluación subjetivas: En ausencia de respuestas conocidas, los usuarios a menudo deben recurrir a métricas subjetivas o heurísticas para evaluar la calidad de los resultados. Estas métricas pueden variar según el contexto y los requisitos específicos de la aplicación.

* Interpretación y conocimiento del dominio: La evaluación de los modelos no supervisados a menudo requiere una comprensión profunda del dominio y la interpretación de los resultados. Los usuarios deben interpretar los patrones o agrupamientos descubiertos y determinar si tienen sentido y son útiles en el contexto específico.

* Validación cruzada limitada: La validación cruzada, una técnica común para evaluar modelos supervisados, puede ser más limitada en los modelos no supervisados. Esto se debe a la falta de etiquetas para comparar y la dificultad para establecer conjuntos de entrenamiento y prueba significativos.

* Subjetividad en la definición de objetivos: En los modelos no supervisados, la definición de objetivos y el éxito del modelo pueden variar según los intereses y las necesidades del usuario. Esto puede llevar a diferentes interpretaciones y evaluaciones subjetivas de los resultados.

Dado que la evaluación en los modelos no supervisados puede ser subjetiva, es importante involucrar a expertos en el dominio y realizar una validación exhaustiva en el contexto específico de la aplicación. Además, la comparación con métodos alternativos o la realización de pruebas de sensibilidad puede ayudar a obtener una evaluación más completa y robusta.
En resumen, la evaluación de los modelos no supervisados a menudo implica un componente subjetivo debido a la falta de etiquetas o respuestas previas. La interpretación de los resultados, las métricas de evaluación y la definición de objetivos pueden variar según el contexto y los requisitos específicos de la aplicación, lo que requiere la participación de expertos en el dominio y una validación cuidadosa.


### Resumen

Acá debemos resumir las principales ideas del capitulo. Todos los capítulos deben tenerlo


### Literatura

Detalle de los libros que se utilizaron (con capítulo incluido)