# Introducción a Machine Learning y ciclo de vida de proyectos
**Fecha:** 2025-05-29

---

## 🎯 Objetivos de la sesión
- Comprender qué es Machine Learning y cómo se relaciona con la Inteligencia Artificial.
- Conocer los tipos principales de algoritmos de ML y sus aplicaciones.
- Entender el ciclo de vida de un proyecto de ML y sus fases clave.


## 🤖 ¿Qué es Inteligencia Artificial y qué es Machine Learning?

![artificial_intelligence](./images/artificial_intelligence.png)

- **Inteligencia Artificial (IA)** es la disciplina que busca que las máquinas tomen decisiones inteligentes.
- **Machine Learning (ML)** es una rama de la IA que se basa en aprender a partir de los datos.
- **Deep Learning (DL)** es una subrama de ML basada en redes neuronales profundas.

### 📌 Ejemplos comunes
- Aprobación de crédito
- Detección de fraude
- Clasificación de imágenes
- Reconocimiento de voz


## 🧪 Tipos de aprendizaje automático

![machine_learning](./images/machine_learning.png)

### Aprendizaje supervisado
- Clasificación: resultados discretos
- Regresión: resultados continuos

### Aprendizaje no supervisado
- Agrupamiento: segmentar sin etiquetas
- Reducción de dimensionalidad

### Aprendizaje por refuerzo
- Agente que aprende por retroalimentación del entorno \* *No cubriremos esta rama en este curso, pero es importante conocerla*

**En este curso nos enfocaremos principalmente en modelos de aprendizaje supervisado.**

### 📋 Tabla de ejemplos de algoritmos

Estos son algunos de los algoritmos que estudiaremos o mencionaremos a lo largo del curso, con ejemplos reales en diferentes dominios.

| Tipo          | Algoritmos típicos                  | Ejemplos de uso                     |
|---------------|-------------------------------------|-------------------------------------|
| Clasificación | Logistic Regression, SVM, Trees     | Diagnóstico médico, detección spam |
| Regresión     | Linear Regression, Random Forest    | Predicción de precios               |
| Agrupamiento  | K-Means, DBSCAN, Agglomerativo      | Segmentación de clientes            |

## 📈 Ciclo de vida de un proyecto de ML

Los proyectos de ML suelen ser iterativos y multifásicos. A continuación, se describe cada una de las fases típicas en un flujo de trabajo completo:

- **Recolección de datos**
- **Limpieza y preparación**
- **Entrenamiento del modelo**
- **Evaluación y validación**
- **Despliegue en producción**
- **Monitoreo y mejora continua**


Este ciclo de vida se relaciona estrechamente con el enfoque CRISP-DM, ampliamente adoptado en proyectos de analítica de datos.

![crisp_dm](./images/crisp_dm.png)

## 💼 Roles técnicos en un proyecto de ML/IA

![roles](./images/roles.png)

🟠 DevOps (Development Operations)

Rol: Infraestructura general, automatización y despliegue de software.
Responsabilidades en ML:
- Gestionar entornos cloud y recursos (máquinas, redes, contenedores).
- Proveer infraestructura para entrenamiento y despliegue de modelos.
- Integrar pipelines de CI/CD (Integración y Entrega Continua).

🔗 Colabora con: MLOps para extender buenas prácticas de software al flujo ML.

⸻

🔵 MLOps (Machine Learning Operations)

Rol: Puente entre ciencia de datos e infraestructura productiva.
Responsabilidades en ML:
- Desplegar, monitorear y versionar modelos.
- Crear pipelines automatizados de entrenamiento, prueba y despliegue.
- Integrar herramientas como MLflow, SageMaker, Kubeflow, etc.
- Garantizar reproducibilidad, escalabilidad y seguridad del ciclo de vida ML.

🔗 Colabora con: Data Scientists, DevOps, y Data Engineers.

⸻

🔵 Data Scientist

Rol: Desarrollo de modelos de Machine Learning.
Responsabilidades en ML:
- Comprender el problema de negocio y formular hipótesis.
- Explorar datos, seleccionar características, entrenar y validar modelos.
- Realizar análisis estadísticos y métricas.
- Comunicar hallazgos y entregar modelos listos para producción.

🔗 Colabora con: ML Engineers, MLOps y Data Analytics.

⸻

🔵 ML Engineer (Ingeniero de ML)

Rol: Especialista en construir sistemas ML listos para producción.
Responsabilidades en ML:
- Convertir prototipos de modelos en soluciones escalables.
- Optimizar rendimiento (inferencia rápida, bajo costo).
- Escribir código limpio y modular con buenas prácticas de ingeniería.
- Hacer pruebas, validar modelos y preparar contenedores o APIs.

🔗 Colabora con: Data Scientists, Data Engineers y MLOps.

⸻

🔵 Data Engineer

Rol: Encargado de la recolección, almacenamiento y procesamiento de datos.
Responsabilidades en ML:
- Crear pipelines de ingestión (ETL/ELT).
- Diseñar modelos de datos eficientes (SQL, NoSQL, lakes).
- Garantizar la calidad y disponibilidad de los datos para analítica/modelado.
- Facilitar acceso a datos en tiempo real o batch.

🔗 Colabora con: ML Engineers, Data Scientists y Analytics Engineers.

⸻

🟣 Analytics Engineer (Ingeniero de Analítica de Datos)

Rol: Transformar datos crudos en métricas listas para análisis y visualización.
Responsabilidades en ML:
- Crear transformaciones reproducibles (con dbt u otras herramientas).
- Diseñar métricas y KPIs para evaluar modelos e impacto.
- Servir como puente entre data engineering y análisis de negocio.

🔗 Colabora con: Data Engineers, Data Scientists y analistas.

⸻

🟣 Data Analyst / Data Analytics

Rol: Analiza datos para generar insights estratégicos.
Responsabilidades en ML:
- Evaluar resultados del modelo y comunicar impacto al negocio.
- Identificar nuevas oportunidades de uso de ML.
- Construir dashboards y reportes.
- Traducir necesidades del negocio a preguntas analíticas.

🔗 Colabora con: Data Scientists, Analytics Engineers y stakeholders de negocio.

## 📚 ¿Qué veremos en este curso?
- Fundamentos de desarrollo con Python para ML
- Creación de pipelines reproducibles
- Seguimiento de experimentos con MLflow
- Alternativas MLOps y buenas prácticas

## 📝 Actividad inicial
- ¿Qué parte del ciclo de vida has trabajado más?
- ¿Con qué tecnologías has trabajado antes (Python, AWS, ML)?