# Introducción a Machine Learning (ML)

## ¿Qué es Machine Learning?

**Machine Learning (ML)** o **aprendizaje automático** es una rama de la inteligencia artificial que permite que las máquinas aprendan a partir de datos, **sin ser explícitamente programadas** para cada tarea específica.

En lugar de decirle a una computadora qué hacer paso a paso, le damos datos y **algoritmos** que le permiten **identificar patrones** y tomar decisiones por sí sola.

---

## Tipos de Machine Learning

### 1. **Aprendizaje Supervisado**

**¿Qué es?**
El algoritmo aprende a partir de **datos etiquetados**, es decir, cada ejemplo en el conjunto de datos incluye la respuesta correcta. El modelo aprende una función que relacione las entradas con las salidas.

**Tareas comunes:**
- **Clasificación:** Predecir una categoría (ej. spam o no spam)
- **Regresión:** Predecir un valor numérico (ej. precio de una casa)

**Casos de uso:**
- Diagnóstico médico (enfermedad: sí/no)
- Reconocimiento facial (identificar a una persona)
- Detección de fraude en transacciones bancarias
- Predicción de ventas futuras

---

### 2. **Aprendizaje No Supervisado**

**¿Qué es?**
Se usa cuando los datos **no tienen etiquetas**. El algoritmo debe encontrar patrones, agrupaciones o estructuras ocultas en los datos sin que le indiquemos qué buscar.

**Tareas comunes:**
- **Clustering (agrupamiento):** Dividir datos en grupos similares (ej. segmentación de clientes)
- **Reducción de dimensionalidad:** Simplificar datos manteniendo información relevante (ej. PCA)

**Casos de uso:**
- Agrupamiento de usuarios por comportamiento de compra
- Detección de patrones de fraude desconocidos
- Análisis de sentimientos o temas en textos


![Tipos de Machine Learning](https://dc722jrlp2zu8.cloudfront.net/media/uploads/2019/09/30/cap1-machine-learning4.png)
---

### 3. **Aprendizaje Semi-Supervisado**

**¿Qué es?**
Es un enfoque intermedio entre supervisado y no supervisado. Se usa cuando tienes **muchos datos sin etiquetar** y **pocos etiquetados**. El algoritmo usa ambos tipos de datos para aprender.

**¿Por qué es útil?**
Etiquetar datos puede ser costoso o llevar mucho tiempo (por ejemplo, etiquetar imágenes médicas). El semi-supervisado permite aprovechar grandes volúmenes de datos no etiquetados.

**Casos de uso:**
- Clasificación de correos con pocos ejemplos marcados como spam
- Reconocimiento de voz con muestras parcialmente transcritas
- Análisis de documentos legales con pocas etiquetas humanas
- Diagnóstico médico con pocos exámenes clínicos verificados

---

### 4. **Aprendizaje por Refuerzo**

**¿Qué es?**
En este tipo de aprendizaje, un **agente** toma decisiones dentro de un **entorno**, y aprende a través de **recompensas o penalizaciones**. El objetivo es **maximizar la recompensa acumulada** a lo largo del tiempo.

No necesita datos históricos, aprende de la **interacción continua** con su entorno.

**Componentes clave:**
- **Agente:** quien toma decisiones
- **Entorno:** donde actúa el agente
- **Estado:** la condición del entorno en un momento dado.
- **Acciones:** posibles movimientos o decisiones
- **Recompensas:** señales de éxito o fracaso

**Casos de uso:**
- Juegos (ajedrez, Go, videojuegos)
- Robótica (que un robot aprenda a caminar o agarrar objetos)
- Sistemas de recomendación que aprenden del comportamiento del usuario
- Optimización de logística en tiempo real
- Control automático (vehículos autónomos)

![Refuerzo](https://media.licdn.com/dms/image/v2/D4E12AQHCEFeKhwVmcA/article-cover_image-shrink_720_1280/article-cover_image-shrink_720_1280/0/1721197588444?e=2147483647&v=beta&t=DTPZYutqu56m6ietNKbRE3W1rakx-mXHck8IGeS_cgk)
---

## Casos de uso en la vida real por tipo de ML

| Tipo de ML              | Industria        | Aplicación ML                                        |
|-------------------------|------------------|-----------------------------------------------------|
| Supervisado             | Finanzas         | Predicción de impago, clasificación de riesgo       |
| Supervisado             | Salud            | Diagnóstico a partir de imágenes médicas            |
| No supervisado          | Marketing        | Segmentación de clientes por patrones de compra     |
| No supervisado          | Ciberseguridad   | Detección de anomalías en accesos                   |
| Semi-supervisado        | Educación        | Clasificar preguntas con pocos ejemplos anotados    |
| Semi-supervisado        | Legal            | Categorizar documentos jurídicos con mínima guía    |
| Refuerzo                | Transporte       | Rutas óptimas de entrega con vehículos autónomos    |
| Refuerzo                | Finanzas         | Estrategias de trading que aprenden en el mercado   |

---

## Beneficios del Machine Learning

✅ Automatiza tareas repetitivas y complejas  
✅ Mejora la toma de decisiones basada en datos  
✅ Aprende y mejora con el tiempo  
✅ Detecta patrones que el ser humano podría pasar por alto  
✅ Personaliza experiencias (como Netflix, Amazon, Spotify)

---

## Limitaciones y restricciones

⚠️ **Requiere muchos datos** (y de buena calidad)  
⚠️ Puede ser **difícil de interpretar** ("caja negra")  
⚠️ Riesgo de **sesgos** si los datos no son representativos  
⚠️ Requiere tiempo y poder computacional para entrenar modelos  
⚠️ **No garantiza 100% de precisión**

---

## Herramientas populares para ML en Python

- **scikit-learn:** para modelos clásicos y fáciles de usar
- **pandas / numpy:** para manejo y análisis de datos
- **matplotlib / seaborn:** para visualización
- **TensorFlow / PyTorch:** para modelos más complejos y redes neuronales

---

## Conclusión

El Machine Learning transforma datos en decisiones. Al comprender sus fundamentos, tipos y casos de uso, puedes aplicar esta poderosa herramienta para resolver problemas reales en cualquier industria.



In [1]:
## Ejemplo práctico (supervisado)

from sklearn.linear_model import LinearRegression
import numpy as np

# Queremos predecir salario con base en años de experiencia
experiencia = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
salario = np.array([30000, 35000, 40000, 45000, 50000])

modelo = LinearRegression()
modelo.fit(experiencia, salario)

prediccion = modelo.predict([[6]])
print("Predicción para 6 años de experiencia:", prediccion[0])

Predicción para 6 años de experiencia: 55000.0
