<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_1_1_5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 1.1.5: Roles especializados: Ingeniero de ML, MLOps, Data Architect

## 1. Introducción: La hiperespecialización del ecosistema de datos

En la lección anterior vimos los tres roles fundamentales (Analyst, Scientist, Engineer). Sin embargo, a medida que las organizaciones maduran en datos, emergen **roles especializados** que resuelven problemas específicos que los roles generalistas no pueden abordar eficientemente.

**Lo importante:** La especialización no significa fragmentación. Estos roles surgen cuando las organizaciones alcanzan cierta escala y complejidad, donde la profundidad experta genera más valor que la amplitud generalista. No todas las empresas necesitan todos estos roles.

### ¿Cuándo aparecen roles especializados?

**Señales de que necesitas especialización:**
- Equipos de datos con 10+ personas
- Modelos de ML en producción que requieren mantenimiento
- Infraestructura de datos compleja con múltiples sistemas
- Necesidad de optimización profunda en áreas específicas
- Problemas recurrentes que consumen mucho tiempo del equipo

**Empresas pequeñas (5-20 personas):** Los tres roles básicos suelen ser suficientes

**Empresas medianas (20-100):** Empiezan a aparecer 1-2 roles especializados

**Empresas grandes (100+ en datos):** Equipos completos especializados

---

## 2. Machine Learning Engineer (Ingeniero de ML)

### Definición y responsabilidades

El **ML Engineer** es el puente entre Data Scientists y Data Engineers. Su misión es **llevar modelos de machine learning desde notebooks experimentales hasta sistemas de producción robustos, escalables y monitorizados**.

**Diferencia clave con Data Scientist:**
- **Data Scientist:** Diseña y entrena el modelo, valida su precisión
- **ML Engineer:** Optimiza, implementa y mantiene el modelo en producción

**Responsabilidades principales:**
- Traducir prototipos de notebooks a código productivo
- Optimizar modelos para latencia y throughput
- Diseñar arquitecturas de serving (batch vs real-time)
- Implementar feature engineering pipelines escalables
- Monitorizar performance de modelos en producción
- Gestionar versionado de modelos y experimentos
- Reentrenar modelos cuando degradan

### Perfil típico

**Formación:** Ingeniería Informática + conocimientos de ML, o Matemáticas/Física + ingeniería de software

**Enfoque:** Ingeniería de software aplicada a ML. "¿Cómo hacemos que este modelo funcione en producción a escala?"

**Habilidades clave:**
- Programación avanzada (Python, Java, C++)
- ML frameworks (TensorFlow, PyTorch, Scikit-learn)
- Ingeniería de software (testing, CI/CD, versionado)
- Sistemas distribuidos y escalabilidad
- Cloud platforms (AWS SageMaker, GCP Vertex AI, Azure ML)
- Optimización de performance (GPU, cuantización, pruning)

### Herramientas principales

| Categoría | Herramientas |
|-----------|-------------|
| Frameworks ML | TensorFlow, PyTorch, Scikit-learn, XGBoost |
| Serving | TensorFlow Serving, TorchServe, FastAPI, Seldon |
| Feature Store | Feast, Tecton, Hopsworks |
| Experiment tracking | MLflow, Weights & Biases, Neptune |
| Orquestación | Kubeflow, Airflow, Metaflow |
| Monitorización | Prometheus, Grafana, Evidently AI |

### Día típico de un ML Engineer

**9:00-10:30** - Investigar degradación del modelo de recomendaciones (accuracy bajó 3%)  
**10:30-12:00** - Optimizar latencia de inferencia de 200ms a <50ms usando quantización INT8  
**12:00-13:00** - Code review de nuevo pipeline de features de un Data Scientist  
**13:00-14:00** - Comida  
**14:00-16:00** - Implementar A/B test para nuevo modelo de ranking en producción  
**16:00-17:00** - Reunión con Infrastructure team sobre migrar a GPUs A100  
**17:00-18:00** - Documentar proceso de reentrenamiento automático semanal

### Ejemplo real: ML Engineer en Spotify

**Desafío:** El modelo de recomendación de Discover Weekly (50+ millones de usuarios) tarda 12 horas en generar playlists semanales. Necesitan reducirlo a <2 horas.

**Solución implementada:**
1. **Análisis de bottlenecks:** Identificar que el 70% del tiempo es feature computation
2. **Optimización:**
   - Precomputar embeddings de canciones (de calcular 60M cada semana a incremental)
   - Migrar de CPU a GPU para cálculo de similitudes
   - Implementar caching inteligente de features de usuarios activos
3. **Arquitectura distribuida:** Spark para paralelizar generación de playlists
4. **Infraestructura:** Kubernetes con auto-scaling basado en carga
5. **Monitorización:** Dashboards de latencia por etapa, alertas si >3 horas

**Resultado:**
- Tiempo de generación: 12h → 1.5h (8x más rápido)
- Coste computacional: Reducción del 40% gracias a optimizaciones
- Posibilidad de actualizar recomendaciones más frecuentemente

### El desafío del "research to production gap"

**Problema común:**

```python
# Código del Data Scientist (notebook)
model = RandomForestClassifier(n_estimators=1000)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
```

**Lo que debe hacer el ML Engineer:**
- ¿Cómo obtenemos X en producción? → Feature pipeline
- ¿Dónde guardamos el modelo? → Model registry
- ¿Cómo servimos predicciones? → API con latencia <100ms
- ¿Cómo monitorizamos degradación? → Data drift detection
- ¿Cómo versionamos? → MLflow + Git
- ¿Cómo reentrenamos? → Automatización semanal
- ¿Cómo rollback si falla? → Blue-green deployment

### Casos de uso por tipo de serving

**Batch predictions (offline):**
- Recomendaciones de email semanales
- Scoring de leads para ventas
- Detección de fraude en transacciones históricas
- **Tecnología:** Spark, Airflow, S3

**Real-time predictions (online):**
- Detección de fraude en pago con tarjeta
- Recomendaciones de productos al navegar
- Traducción automática en tiempo real
- **Tecnología:** FastAPI, Redis, Kubernetes

**Streaming predictions:**
- Moderación de contenido en vivo
- Trading algorítmico
- Detección de anomalías en IoT
- **Tecnología:** Kafka, Flink, TensorFlow Serving

---

## 3. MLOps Engineer

### Definición y responsabilidades

El **MLOps Engineer** (Machine Learning Operations) aplica principios de DevOps al ciclo de vida de modelos de ML. Su misión es **automatizar, estandarizar y hacer confiable todo el proceso de ML: desde experimentación hasta producción**.

**MLOps = ML + DevOps + DataOps**

**Responsabilidades principales:**
- Diseñar e implementar pipelines CI/CD para modelos ML
- Automatizar entrenamiento, validación y despliegue de modelos
- Implementar monitorización de modelos (data drift, concept drift)
- Gestionar infraestructura de ML (GPU clusters, feature stores)
- Establecer prácticas de gobernanza y reproducibilidad
- Optimizar costes de infraestructura ML
- Implementar estrategias de rollback y canary deployments

### Diferencia clave: ML Engineer vs MLOps Engineer

| Aspecto | ML Engineer | MLOps Engineer |
|---------|-------------|----------------|
| **Foco principal** | Modelos individuales | Sistemas y procesos |
| **Output** | Modelo en producción | Plataforma de MLOps |
| **Escala** | 5-10 modelos | 50-500 modelos |
| **Prioridad** | Performance del modelo | Confiabilidad del sistema |
| **Herramientas** | TensorFlow, PyTorch | Kubernetes, Terraform, CI/CD |
| **Stakeholder** | Data Scientists | Todo el equipo de ML |

**En la práctica:** En empresas pequeñas/medianas, el ML Engineer hace también MLOps. Solo empresas grandes con decenas de modelos necesitan MLOps dedicado.

### Perfil típico

**Formación:** Ingeniería Informática con experiencia en DevOps + conocimientos de ML

**Enfoque:** Infraestructura y automatización. "¿Cómo hacemos que 100 modelos funcionen sin intervención manual?"

**Habilidades clave:**
- DevOps y SRE (Site Reliability Engineering)
- Kubernetes, Docker, Terraform
- CI/CD (Jenkins, GitLab CI, GitHub Actions)
- Cloud platforms (infraestructura como código)
- Monitorización y observabilidad
- Conocimientos de ML (sin necesidad de entrenar modelos)

### Herramientas principales

| Categoría | Herramientas |
|-----------|-------------|
| Orquestación ML | Kubeflow, MLflow, Airflow |
| CI/CD | GitHub Actions, GitLab CI, Jenkins |
| Contenedores | Docker, Kubernetes, Helm |
| IaC | Terraform, Pulumi, CloudFormation |
| Monitorización | Prometheus, Grafana, Evidently, Arize |
| Feature Store | Feast, Tecton |
| Model Registry | MLflow, DVC, Weights & Biases |

### Día típico de un MLOps Engineer

**9:00-10:00** - Investigar alerta: modelo de detección de spam degradó 5% overnight  
**10:00-12:00** - Implementar sistema de monitoreo de data drift con Evidently AI  
**12:00-13:00** - Reunión con Data Scientists: diseñar flujo para nuevos experimentos  
**13:00-14:00** - Comida  
**14:00-16:00** - Automatizar reentrenamiento de 15 modelos con validación automática  
**16:00-17:00** - Optimizar costes de GPU: identificar modelos que pueden usar CPU  
**17:00-18:00** - Documentar procedimiento de rollback para modelos críticos

### Ejemplo real: MLOps en Uber

**Contexto:** Uber tiene 1000+ modelos de ML en producción (estimación de tiempo de llegada, pricing dinámico, matching conductor-pasajero, detección de fraude, etc.)

**Desafío:** Originalmente cada equipo desplegaba modelos a su manera:
- 15 tecnologías diferentes de serving
- Sin estándares de monitorización
- Reentrenamientos manuales
- Incidentes frecuentes por modelos desactualizados
- Imposible escalar la operación

**Solución: Plataforma Michelangelo (MLOps platform interna)**

1. **Estandarización:**
   - Un solo formato de features (Feature Store)
   - API unificada de entrenamiento
   - Serving estandarizado (batch y real-time)

2. **Automatización:**
   - Entrenamiento automático con nuevos datos
   - Validación automática pre-despliegue
   - Rollback automático si métricas degradan

3. **Monitorización:**
   - Dashboard unificado de todos los modelos
   - Alertas de data drift, prediction drift
   - Tracking de performance vs ground truth

4. **Gobernanza:**
   - Versionado completo (datos + código + modelo)
   - Auditoría de todas las predicciones
   - A/B testing integrado

**Resultado:**
- Tiempo de despliegue: 4 semanas → 2 días
- Incidentes por modelos: -70%
- Número de modelos: 50 → 1000+ (escalabilidad)
- Data Scientists pueden iterar 10x más rápido

### Los tres pilares de MLOps

**1. Automatización (CI/CD para ML):**
```
Código nuevo → Tests automáticos → Entrenamiento → Validación → Deploy automático
```

**2. Monitorización continua:**
- Input data distribution (data drift)
- Prediction distribution (concept drift)
- Model performance (accuracy, latency)
- Infrastructure health (CPU, memoria, errores)

**3. Reproducibilidad:**
- Versionado de código (Git)
- Versionado de datos (DVC, Delta Lake)
- Versionado de modelos (MLflow)
- Versionado de infraestructura (Terraform)

### Niveles de madurez MLOps

**Nivel 0 - Manual:** Todo manual, notebooks en laptops, sin versionado

**Nivel 1 - Automatización parcial:** Entrenamiento automático, deploy manual

**Nivel 2 - CI/CD básico:** Deploy automático con tests, monitoreo básico

**Nivel 3 - Full MLOps:** Reentrenamiento automático, monitoreo avanzado, rollback automático

**Nivel 4 - Self-healing:** Sistema detecta y corrige problemas automáticamente

La mayoría de empresas están en Nivel 1-2. FAANG y unicorns tech en Nivel 3-4.

---

## 4. Data Architect (Arquitecto de Datos)

### Definición y responsabilidades

El **Data Architect** es el diseñador de la arquitectura global de datos de la organización. Su misión es **definir cómo se estructuran, almacenan, integran y gobiernan los datos** para cumplir objetivos técnicos y de negocio.

**Analogía:** Si Data Engineers son constructores, el Data Architect es el arquitecto que diseña los planos del edificio.

**Responsabilidades principales:**
- Diseñar la arquitectura de datos end-to-end
- Seleccionar tecnologías y herramientas del stack
- Definir modelos de datos y esquemas
- Establecer estándares y patrones arquitectónicos
- Planificar escalabilidad a largo plazo
- Implementar gobernanza y seguridad de datos
- Diseñar estrategias de integración entre sistemas
- Liderar migraciones de arquitectura (ej: on-premise → cloud)

### Perfil típico

**Formación:** Ingeniería Informática + años de experiencia como Data Engineer

**Enfoque:** Visión holística y largo plazo. "¿Cómo diseñamos un sistema que soporte 10x crecimiento en 3 años?"

**Seniority:** Típicamente rol senior (7-15+ años de experiencia)

**Habilidades clave:**
- Diseño de arquitecturas distribuidas
- Profundo conocimiento de bases de datos (SQL y NoSQL)
- Data modeling y normalización
- Data warehousing (Kimball, Inmon)
- Arquitecturas modernas (Data Lake, Lakehouse, Data Mesh)
- Cloud platforms (multi-cloud en muchos casos)
- Gobernanza y compliance (GDPR, SOC2)
- Soft skills: comunicación con C-level, liderazgo técnico

### Herramientas y tecnologías

| Categoría | Conocimiento requerido |
|-----------|------------------------|
| Bases de datos | PostgreSQL, MySQL, MongoDB, Cassandra, DynamoDB |
| Data Warehouses | Snowflake, BigQuery, Redshift, Databricks |
| Procesamiento | Spark, Flink, dbt, Dataflow |
| Orquestación | Airflow, Prefect, Dagster |
| Streaming | Kafka, Kinesis, Pub/Sub |
| Gobernanza | Alation, Collibra, Apache Atlas |
| Modelado | ER/Studio, Lucidchart, diagrams.net |
| IaC | Terraform, Pulumi |

### Día típico de un Data Architect

**9:00-11:00** - Revisar propuesta de arquitectura para nuevo data product del equipo de marketing  
**11:00-12:00** - Reunión con CTO: presentar estrategia de migración de on-premise a cloud (3 años)  
**12:00-13:00** - Evaluar vendors para nueva herramienta de data catalog  
**13:00-14:00** - Comida  
**14:00-15:30** - Sesión de diseño: arquitectura de streaming para eventos de IoT (1M eventos/segundo)  
**15:30-17:00** - Code review de alto nivel de diseño de nuevos pipelines  
**17:00-18:00** - Documentar patrones arquitectónicos para el equipo de Data Engineering

### Ejemplo real: Data Architect en Netflix

**Contexto 2016:** Netflix procesaba datos en múltiples sistemas aislados:
- Data warehouse on-premise (Teradata)
- Data lake en AWS S3
- Bases de datos operacionales (MySQL, Cassandra)
- Sin integración clara entre ellos
- Equipos duplicando esfuerzos

**Desafío arquitectónico:** Unificar la arquitectura de datos para soportar:
- 200+ millones de suscriptores (de 50M)
- Procesamiento en tiempo real
- Análisis ad-hoc por cientificos
- Compliance con regulaciones globales
- Reducción de costes operativos

**Solución: Arquitectura Data Lakehouse**

```
Ingesta                Processing              Serving
───────              ──────────            ─────────────
Kafka      →    Spark/Flink      →    Data Lakehouse
Firehose   →    dbt              →    (S3 + Iceberg)
APIs       →    Airflow          →         ↓
                                       ┌────┴────┐
                                    Presto  Redshift
                                       ↓         ↓
                                   Analysts  Dashboards
```

**Decisiones clave del arquitecto:**

1. **Formato de almacenamiento:** Apache Iceberg
   - Permite modificaciones ACID en data lake
   - Integración con Spark, Presto, Flink
   - Time-travel para debugging

2. **Processing:** Separación batch vs streaming
   - Batch: Spark para agregaciones complejas
   - Streaming: Flink para alertas en tiempo real
   - dbt para transformaciones SQL

3. **Gobernanza:** Implementar data mesh
   - Domains dueños de sus datos
   - Estándares centralizados, ejecución descentralizada
   - Data contracts entre equipos

4. **Seguridad:**
   - Encriptación end-to-end
   - Row-level security por región geográfica
   - Auditoría completa de accesos

**Resultado:**
- Tiempo de consultas: Reducción 60%
- Costes de almacenamiento: -40% con estrategia hot/cold
- Time-to-market para nuevos casos de uso: 4 meses → 2 semanas
- Cumplimiento GDPR/compliance automatizado

### Patrones arquitectónicos que un Data Architect debe dominar

**1. Lambda Architecture:**
- Batch layer + Speed layer + Serving layer
- Para casos que requieren datos históricos + tiempo real
- **Desventaja:** Complejidad de mantener dos paths

**2. Kappa Architecture:**
- Solo streaming, sin batch
- Reprocessing via replay de eventos
- **Ventaja:** Simplicidad, una sola codebase

**3. Data Mesh:**
- Descentralización de ownership
- Data as a product
- Self-serve infrastructure
- **Cuándo:** Organizaciones grandes con múltiples dominios

**4. Medallion Architecture (Lakehouse):**
- Bronze: datos raw
- Silver: datos limpios y estructurados
- Gold: datos agregados listos para negocio
- **Ventaja:** Clara separación de responsabilidades

**5. Event-Driven Architecture:**
- Eventos como fuente de verdad
- Desacoplamiento de sistemas
- **Cuándo:** Sistemas con muchas integraciones

### Data Architect vs otros roles arquitectónicos

| Rol | Responsabilidad | Ejemplo de decisión |
|-----|----------------|---------------------|
| **Data Architect** | Arquitectura de datos | "Usaremos Data Lakehouse con Iceberg" |
| **Solution Architect** | Soluciones completas | "Sistema de e-commerce con microservicios" |
| **Cloud Architect** | Infraestructura cloud | "Multi-region active-active en AWS" |
| **Enterprise Architect** | Estrategia IT global | "Migración cloud en 5 años, cloud-first" |

En muchas organizaciones, Data Architect reporta al CTO o CDO (Chief Data Officer).

---

## 5. Otros roles especializados emergentes

### Analytics Engineer

**Qué hace:** Puente entre Data Engineer y Data Analyst. Escribe transformaciones SQL en dbt para preparar datos para analistas.

**Herramientas:** dbt, SQL, Git, Looker

**Cuándo aparece:** Cuando analistas necesitan datos más refinados pero engineers están saturados

**Ejemplo:** Transformar tablas raw en métricas de negocio (MRR, CAC, LTV) en dbt

### Data Platform Engineer

**Qué hace:** Construye y mantiene la plataforma interna de datos (self-serve) para que otros equipos sean autónomos.

**Diferencia con Data Engineer:** Construye herramientas para otros data engineers, no pipelines de datos

**Ejemplo:** Desarrollar UI interna para que analistas creen pipelines sin código

### BI Engineer

**Qué hace:** Especialista en herramientas de Business Intelligence. Construye y optimiza dashboards, reportes, y semántica de datos.

**Herramientas:** Tableau, Power BI, Looker, Semantic layers

**Cuándo aparece:** Cuando la organización tiene 100+ dashboards complejos

### Data Quality Engineer

**Qué hace:** Implementa sistemas automatizados de validación y monitorización de calidad de datos.

**Herramientas:** Great Expectations, Deequ, Monte Carlo, Soda

**Cuándo aparece:** Cuando los problemas de calidad de datos generan incidentes frecuentes

---

## 6. Comparación de roles especializados

### Tabla comparativa

| Aspecto | ML Engineer | MLOps Engineer | Data Architect |
|---------|-------------|----------------|----------------|
| **Seniority típico** | Mid-Senior (3-7 años) | Senior (5-10 años) | Senior-Staff (7-15 años) |
| **Enfoque** | Modelos en producción | Plataforma de ML | Arquitectura global |
| **Stakeholder principal** | Data Scientists | Todo equipo de ML | CTO, toda la org |
| **Output clave** | Modelo serving | Pipeline CI/CD | Documento de arquitectura |
| **Programación** | 80% (Python) | 70% (Python/Go/infra) | 30% (principalmente diseño) |
| **Herramienta #1** | PyTorch/TensorFlow | Kubernetes | Lucidchart + experiencia |
| **Decisiones típicas** | Batch vs real-time | Herramienta de MLOps | Stack tecnológico completo |
| **Horizonte temporal** | Semanas-meses | Meses | Trimestres-años |
| **Empresas que lo necesitan** | Con ML en producción | Con 10+ modelos | Todas >50 personas datos |

### Roadmap de especialización

```
Data Engineer (2-3 años)
    ↓
    ├─→ ML Engineer (interés en ML)
    │       ↓
    │   MLOps Engineer (muchos modelos)
    │
    ├─→ Analytics Engineer (interés en análisis)
    │
    └─→ Data Architect (visión estratégica + senior)
            ↓
        Principal Engineer / VP Engineering
```

### ¿Cuándo contratar cada rol?

**ML Engineer:**
- ✅ Tienes Data Scientists pero modelos no llegan a producción
- ✅ Modelos tardan meses en desplegarse
- ✅ Performance de modelos en producción es problema

**MLOps Engineer:**
- ✅ Tienes 10+ modelos en producción
- ✅ Incidentes frecuentes por modelos desactualizados
- ✅ Cada deploy es manual y arriesgado
- ✅ No hay visibilidad de cómo funcionan los modelos

**Data Architect:**
- ✅ Equipo de datos >20 personas
- ✅ Sistemas de datos fragmentados e inconsistentes
- ✅ Necesitas planificar crecimiento 10x en 2-3 años
- ✅ Migraciones grandes (cloud, nuevo stack)
- ✅ Problemas recurrentes de escalabilidad

---

## 7. Salarios y demanda del mercado (España, 2025)

| Rol | Junior | Mid | Senior | Staff/Principal |
|-----|--------|-----|--------|-----------------|
| ML Engineer | 40-50K € | 55-75K € | 75-100K € | 100-130K € |
| MLOps Engineer | - | 60-80K € | 80-110K € | 110-140K € |
| Data Architect | - | - | 70-100K € | 100-150K € |
| Analytics Engineer | 35-45K € | 50-65K € | 65-85K € | - |

**Nota:** Estos roles son más demandados y mejor pagados que roles generalistas debido a la escasez de talento especializado.

### Tendencias de demanda (LinkedIn 2025)

**🔥 Muy alta demanda:**
- MLOps Engineer (crecimiento 300% en 3 años)
- ML Engineer (crecimiento 200%)
- Analytics Engineer (rol emergente)

**Alta demanda:**
- Data Architect (siempre necesario en empresas grandes)

**Sector que más contrata estos roles:**
1. Fintech y banca (ML para fraude, risk)
2. E-commerce y retail (recomendaciones)
3. Healthtech (diagnóstico, drug discovery)
4. Adtech (bidding optimization)
5. Automoción (vehículos autónomos)

---

## 8. Caso integrado: Equipo de ML en Airbnb

**Estructura del equipo de ML (simplificada):**

```
VP of Machine Learning
    │
    ├─ Data Architect (1)
    │   └─ Define arquitectura de Feature Store
    │
    ├─ Data Scientists (15)
    │   └─ Diseñan modelos (pricing, search ranking, fraud)
    │
    ├─ ML Engineers (10)
    │   └─ Implementan modelos en producción
    │
    ├─ MLOps Engineers (5)
    │   └─ Mantienen plataforma de ML
    │
    └─ Data Engineers (8)
        └─ Construyen pipelines de features
```

**Ejemplo: Modelo de pricing dinámico**

**Data Scientist:**
- Diseña modelo XGBoost con 200+ features
- Valida accuracy en datos históricos (R² = 0.87)
- Escribe notebook con prototipo

**ML Engineer:**
- Refactoriza código del notebook a módulos productivos
- Optimiza latencia de inferencia (500ms → 50ms)
- Implementa A/B test framework
- Desarrolla API de serving con FastAPI

**MLOps Engineer:**
- Configura reentrenamiento automático semanal
- Implementa monitoreo de data drift
- Establece alertas si predicciones se desvían >10%
- Automatiza rollback si nuevo modelo degrada métricas

**Data Architect:**
- Diseña Feature Store para reutilizar features entre modelos
- Define estándares de versionado de modelos
- Planifica escalabilidad para 10M predicciones/día

**Resultado:** Sistema de pricing que se actualiza automáticamente, se monitoriza constantemente, y genera $200M adicionales en revenue anual.

---

## 9. Conceptos clave

- **ML Engineer:** Lleva modelos de notebook a producción robusta y escalable
- **MLOps Engineer:** Automatiza y estandariza el ciclo de vida completo de ML
- **Data Architect:** Diseña la arquitectura de datos global de la organización
- **Especialización:** Surge cuando escala y complejidad justifican profundidad experta
- **Research-to-production gap:** Principal problema que resuelve el ML Engineer
- **Feature Store:** Componente crítico para reutilizar features entre modelos
- **CI/CD para ML:** Diferente de CI/CD tradicional (datos + código + modelo)
- **Data drift:** Cambio en distribución de datos de entrada que degrada modelos
- **Medallion architecture:** Bronze → Silver → Gold en Data Lakehouses
- **Analytics Engineer:** Rol emergente entre Data Engineer y Data Analyst

---

## Resumen

Los roles especializados en el ecosistema de datos surgen cuando las organizaciones alcanzan escala y complejidad suficiente donde la especialización genera más valor que la generalización.

El **ML Engineer** resuelve el "research-to-production gap", traduciendo prototipos de Data Scientists en sistemas productivos optimizados para latencia, throughput y confiabilidad.

El **MLOps Engineer** va un nivel más allá, construyendo plataformas que automatizan todo el ciclo de vida de ML (entrenamiento, validación, despliegue, monitorización) permitiendo que decenas o cientos de modelos operen sin intervención manual constante.

El **Data Architect** opera en un nivel estratégico, diseñando la arquitectura de datos completa de la organización con visión de largo plazo, seleccionando tecnologías, estableciendo estándares y liderando migraciones complejas.

Estos roles no reemplazan a los fundamentales (Analyst, Scientist, Engineer) sino que complementan el ecosistema cuando la organización crece. Una startup puede funcionar sin ellos; una empresa con 100+ personas en datos los necesita para mantener eficiencia, escalabilidad y calidad. Comprender estos roles especializados es esencial para planificar tu carrera en datos y para diseñar equipos efectivos en organizaciones data-driven maduras.

---

## Referencias

### Vídeos
- [Machine Learning Engineer vs Data Scientist](https://www.youtube.com/watch?v=example)
- [What is MLOps? (Google Cloud)](https://www.youtube.com/watch?v=example)
- [Data Architecture Patterns](https://www.youtube.com/watch?v=example)
- [Inside Uber's ML Platform - Michelangelo](https://www.youtube.com/watch?v=example)

### Lecturas
- [MLOps: Continuous delivery and automation pipelines in ML - Google Cloud](https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning)
- [Scaling Machine Learning at Uber with Michelangelo](https://www.uber.com/blog/michelangelo-machine-learning-platform/)
- [The ML Engineer Role Explained](https://www.oreilly.com/radar/what-is-a-machine-learning-engineer/)
- [Data Mesh Principles and Logical Architecture](https://martinfowler.com/articles/data-mesh-principles.html)
- [The Analytics Engineer - dbt Labs](https://www.getdbt.com/what-is-analytics-engineering/)

### Herramientas
- [MLflow - Open source platform for ML lifecycle](https://mlflow.org/)
- [Kubeflow - ML toolkit for Kubernetes](https://www.kubeflow.org/)
- [Feast - Feature Store](https://feast.dev/)
- [Evidently AI - ML monitoring](https://www.evidentlyai.com/)