# <center> <span style="color:#f6f794">Introducción a: </span> </center>

# <center> <span style="color:#f6f794"> **LM Supervisado: Algoritmos de Clasificación** </span> </center>

### <span style="color:#F2C122">Diseccionando el tema:</span>

#### <span style="color:#c69005"> ¿Qué es "**LM**"? </span>  

ML significa Aprendizaje Automático y es una parte de la IA donde las computadoras aprenden de los datos para tomar decisiones o hacer predicciones por "sí mismas", sin necesidad de instrucciones paso a paso (hard-code). Con el tiempo, los sistemas de ML mejoran en el reconocimiento de patrones y en la precisión de sus predicciones, tal como los humanos aprenden con la práctica.

#### <span style="color:#c69005"> ¿Qué es "**Supervisado**"? </span>  

El aprendizaje supervisado es un tipo de aprendizaje automático en el que un modelo se entrena utilizando datos etiquetados. En este enfoque, cada entrada tiene una salida correspondiente (etiqueta), y el modelo aprende a mapear las entradas con la salida correcta minimizando errores.  

### <span style="color:#c69005"> ¿Cuáles son las **diferencias** entre supervisado y no supervisado? </span>  

| Característica       | Aprendizaje Supervisado                                     | Aprendizaje No Supervisado                              |  
|----------------------|------------------------------------------------------------|---------------------------------------------------------|  
| **Definición**       | El modelo se entrena con datos <span style="color:#f6f794"> **etiquetados** </span> (pares entrada-salida). | El modelo trabaja con datos <span style="color:#f6f794"> **no etiquetados** </span> y busca patrones ocultos. |  
| **Objetivo**         | Aprender la relación entre los datos de entrada y sus etiquetas conocidas. | Descubrir estructuras inherentes en los datos, como grupos o patrones. |  
| **Ejemplo**          | Clasificar correos electrónicos como "spam" o "no spam".  | Agrupar clientes según su comportamiento de compra.    |  
| **Datos**           | Requiere datos etiquetados.                                | Funciona con datos no etiquetados.                     |  
| **Resultado**        | Predice la salida basada en los datos de entrada (clasificación o regresión). | Encuentra patrones o grupos (clustering, asociación).  |  

#### <span style="color:#c69005"> ¿**Qué es** un "Algoritmo de Clasificación"? </span>  

La clasificación es un tipo de aprendizaje supervisado cuyo objetivo es asignar una entrada a una de varias categorías o clases predefinidas en función de sus características. Cada entrada tiene una etiqueta asociada, y el modelo aprende a predecir la clase de nuevos datos no vistos.  

* **Ejemplo:** Dada una imagen de una flor, clasificarla como "rosa", "tulipán" o "margarita".  

#### ¿Confundido?  

| **Técnicas**          | **Descripción**                                             | **Diferencia clave con la Clasificación**                             |  
|-----------------------|------------------------------------------------------------|-----------------------------------------------------------------------|  
| **Clasificación**     | <span style="color:#f6f794"> **Asigna** </span> una entrada a una de varias categorías predefinidas. | <span style="color:#f6f794"> **Cada entrada se asigna a una clase específica** </span> .                        |  
| **Segmentación**      | <span style="color:#f6f794"> **Divide** </span> los datos en segmentos o regiones significativas (imágenes o texto). | Separa datos en partes sin necesariamente asignar una clase.          |  
| **Agrupamiento**      | <span style="color:#f6f794"> **Agrupa** </span> puntos de datos similares sin etiquetas predefinidas. | No busca clasificar cada elemento individual, solo formar grupos.     |  
| **Regresión**         | <span style="color:#f6f794"> **Predice** </span> un valor continuo (numérico) a partir de los datos de entrada. | La clasificación trabaja con clases discretas, la regresión con valores continuos. |  
| **Detección de Anomalías** | <span style="color:#f6f794"> **Identifica** </span> puntos de datos inusuales que se desvían de los patrones normales. | La clasificación asigna etiquetas, mientras que la detección de anomalías busca datos atípicos. |  

#### <span style="color:#c69005"> **Cuándo** usar algoritmos de clasificación y su utilidad </span>  

Los algoritmos de clasificación son útiles cuando tienes datos **etiquetados**, y tu objetivo es **categorizar** nuevos puntos de datos en una de varias **clases** o etiquetas predefinidas.

* <u> Casos de uso típicos: </u>  

    * **Detección de spam en correos electrónicos:** Clasificar correos como "spam" o "no spam".  
    * **Diagnóstico médico:** Clasificar datos de pacientes en categorías como "enfermo" o "sano" según síntomas y pruebas médicas.  
    * **Reconocimiento de imágenes:** Identificar objetos en imágenes, como clasificar una imagen de una mascota como "gato", "perro" o "pájaro".  
    * **Análisis de sentimientos:** Clasificar textos como positivos, negativos o neutrales (común en redes sociales o reseñas de productos).  
    * **Predicción de abandono de clientes:** Determinar si un cliente continuará o abandonará un servicio.  

#### <span style="color:#c69005"> ¿Por qué son útiles los algoritmos de clasificación? </span>  

* **Automatización de decisiones:** Facilita la detección de fraudes, sistemas de recomendación y diagnósticos médicos.  
* **Mejora en la precisión:** Ayuda a predecir datos desconocidos con base en patrones aprendidos.  
* **Categorización eficiente:** Permite clasificar grandes cantidades de datos de forma rápida y precisa.  
* **Gestión de riesgos:** Detecta anomalías y previene problemas, como fraudes o fallos en equipos.  

#### <span style="color:#c69005"> Principales **ventajas** de los algoritmos de clasificación: </span>  

* **Versatilidad:** Se aplican a diversos dominios (finanzas, salud, marketing, etc.).  
* **Escalabilidad:** Manejan grandes volúmenes de datos, especialmente con algoritmos. 
* **Interpretabilidad:** Algunos algoritmos proporcionan información sobre cómo se toman las decisiones, lo que facilita la comprensión del modelo.  

#### <span style="color:#c69005"> **Bibliotecas** de algoritmos de clasificación: </span>  

1. **Scikit-learn**
2. **TensorFlow (Keras)**
3. **XGBoost**
4. **LightGBM**
5. **PyTorch**
6. **CatBoost**
7. **H2O.ai**
8. **MLlib (Apache Spark)**
9. **Fast.ai**
10. **Keras (Standalone)**

______

# <span style="color:#F2C122"> Palabras clave: </span>

- **Aprendizaje Supervisado**: Un tipo de aprendizaje automático donde el modelo se entrena con datos etiquetados para hacer predicciones.
- **Modelo**: Una representación matemática o algoritmo que aprende de los datos para hacer predicciones o tomar decisiones.
- **Datos Etiquetados**: Datos en los que cada entrada está asociada con una salida conocida (etiqueta).
- **Mapeo**: El proceso de aprender una relación entre los datos de entrada y las etiquetas de salida en el aprendizaje supervisado.
- **Características de Entrada**: Los datos que utiliza el modelo para hacer predicciones (por ejemplo, palabras, números, imágenes).
- **Etiquetas de Salida**: Las respuestas correctas o categorías asignadas a las características de entrada durante el entrenamiento.
- **Entrenamiento**: El proceso de enseñar a un modelo proporcionándole datos etiquetados para que aprenda.
- **Función de Pérdida**: Una función que mide cuán lejos están las predicciones del modelo de las respuestas correctas, y el modelo intenta minimizarla.
- **Predicción**: El resultado o salida producida por el modelo basándose en nuevos datos de entrada.
- **Clasificación**: Un tipo de aprendizaje supervisado donde el modelo asigna los datos de entrada a categorías o clases.
- **Regresión**: Un tipo de aprendizaje supervisado donde el modelo predice valores numéricos continuos.
- **Generalización**: La capacidad del modelo de hacer predicciones precisas en nuevos datos no vistos.
- **Optimización**: El proceso de ajustar los parámetros del modelo para minimizar los errores y mejorar el rendimiento.
- **Descenso de Gradiente**: Una técnica de optimización popular utilizada para ajustar los parámetros del modelo reduciendo la función de pérdida.

# <span style="color:#F2C122"> **Palabras clave**, pero de manera más sencilla: </span>

- **Aprendizaje Supervisado**: Enseñar a una computadora a tomar decisiones mostrándole ejemplos con las respuestas correctas.
- **Modelo**: Una herramienta (como un cerebro de robot) que aprende de los datos para ayudar a tomar decisiones o hacer predicciones.
- **Datos Etiquetados**: Información donde ya sabemos la respuesta correcta o categoría (como marcar correos como "spam" o "no spam").
- **Mapeo**: El proceso de conectar lo que la computadora aprende de los datos con la respuesta correcta.
- **Características de Entrada**: La información que la computadora usa para hacer su predicción (como imágenes, palabras o números).
- **Etiquetas de Salida**: La respuesta correcta o categoría que queremos que la computadora prediga (como "spam" o "no spam").
- **Entrenamiento**: El proceso en el que la computadora mira ejemplos y aprende a hacer predicciones.
- **Función de Pérdida**: Una forma de medir cuán equivocadas están las predicciones de la computadora respecto a la respuesta correcta, y el objetivo es hacerlo lo más pequeño posible.
- **Predicción**: La mejor suposición de la computadora sobre cuál debería ser la respuesta para nueva información que nunca ha visto antes.
- **Clasificación**: Un tipo de aprendizaje donde la computadora pone las cosas en diferentes grupos o categorías.
- **Regresión**: Un tipo de aprendizaje donde la computadora predice un número, como adivinar el precio de una casa.
- **Generalización**: Cuando la computadora es buena para hacer predicciones correctas, incluso para cosas nuevas que no ha visto antes.
- **Optimización**: Ajustar el pensamiento de la computadora para mejorar su toma de decisiones y ser mejor prediciendo.
- **Descenso de Gradiente**: Un método que la computadora usa para mejorar aprendiendo de sus errores y mejorando lentamente sus suposiciones.