<!-- # <font color= #bbc28d> **¿Qué son las MLOps?** </font>
Las **Operaciones de Machine Learning** (MLOps en inglés) son el conjunto de procesos o la **secuencia de pasos** que se implementan a la hora de desplegar un modelo de Machine Learning (ML) en un entorno de producción. 

## <font color=#bbc28d> **¿Por qué se necesitan las MLOps?** </font>
Crear un modelo de ML que prediga lo que uno desea con los datos que se le es dado es fácil. No obstante, cuando se requiere un modelo que sea rápido, eficiente y que puede ser usado por un gran número de usuarios la tarea resulta ser más compleja de lo que inicialmente se podría pensar:
-	Rastrear la gran canridad de datos que un modelo de ML necesita es una tarea difícil de realizar por una sola persona. 
-	Mantener un registro de los parámetros y ajustes realizados en el modelo no es sencillo; hay que recordar que incluso el más pequeño cambio puede generar a diferencias enormes en los resultados del modelo.
-	La depuración de un modelo de ML es un arte extremadamente complicado.
-	Por último, pero no menos importante, los modelos se basan en datos de la vida real para predecir, a la par que estos datos cambian, el modelo también, eso indica que hay que llevar un registro de como los datos son modificados para que el modelo pueda seguir funcionando. 

## <font color=#6c9fab> **¿En qué se diferencian las MLOps de las DevOps?** </font>
Las MLOps suelen ser confundidas con las DevOps y aunque ambas son prácticas para mejorar los procesos en los que se desarrollan, emplean y supervisan las aplicaciones de software, también cuentan con diferencias.

Las `DevOps` buscan cerrar la brecha entre los equipos de desarrollo y operaciones. Permiten asegurar que los cambios de código sean probados e integrados automáticamente en producción de manera eficiente y confiable.

Las `MLOps` incorporan los principios de las DevOps al ML, sin embargo, los modelos de ML presentan desafíos que las DevOps no, la recopilación de datos, entrenamiento de modelos y monitoreo de estos son solo algunos de ellos. Las MLOps se centran en automatizar el ciclo de vida del ML, se aseguran de que los modelos no solo sean desarrollados, sino que sean implementados y se vuelvan a entrenar de forma sistemática.

## <font color=#bbc28d> **El ciclo de vida de un proyecto de ML** </font>
El ciclo de vida de un proyecto de ML podría definirse en 5 etapas:
1.	`Alcance (Scoping)` -->  Se define el proyecto, antes de cualquier otro paso es necesario verificar si se puede aplican ML al problema para solucionarlo. Esta etapa incluye analizar si existen datos relevantes y si reflejan un caso de uso en la vida real.
2.	`Ingeniería de Datos (Data Engineering)` --> Esta etapa implica recopilar datos, limpiarlos, darles formato, etiquetarlos y organizarlos.
3.	`Modelado (Modelling)` --> En este paso es cuando se entrena el modelo con los datos procesados, se realizan análisis de error, se define la medida del error y se le hace un seguimiento al rendimiento del modelo.
4.	`Despliegue (Deployment)` --> Aquí se empaca el modelo y se despliega en la nube o en otros dispositivos de ser necesario. El empaquetado del modelo puede variar, podría ser u contenedor Docker, una API, etc.
5.	`Monitoreo [Monitoring]` --> Tras el despliegue, se necesita una infraestructura que:
    - Permita vigilar la infraestructura donde desplegamos, su uso, almacenamiento, etc.
    - Evaluar el modelo, su rendimiento, precisión.
    - En ocasiones, un bucle de retroalimentación cuando el modelo necesite aprender nuevas entradas y predicciones.

## <font color=#bbc28d> **Infraestructura de un modelo de ML para entrar a producción** </font>
Para poder llevar un modelo de ML a producción no basta solo con el código, sino que hay toda una infraestructura a montar, esta se compone de las siguientes partes:
-	`Recolección de Datos `--> Recabar toda la información necesaria para el modelo, dependiendo del problema estos podrían venir en diferentes formatos, desde videos a textos, lo más relevante de esta etapa es recordar que sin datos no hay modelo.
-	`Verificación de los Datos` --> Asegurar que los datos son actuales, confiables y representativos de la vida real, además de contar con una apropiada estructura.
-	`Extracción de características` --> Seleccionar que variables/datos sirven para que el modelo aprenda, en la mayoría de los casos, algunas columnas pueden ser eliminadas ya que no aportan un valor significativo en el modelo.
-	`Configuración` --> Establecer los protocolos para la comunicación, la integración de sistemas y como varios componentes dentro de nuestro pipeline [flujo de trabajo] se comunicarán entre ellos.
-	`Código` --> En esta etapa es cuando se crea el modelo, y se realiza el tuneo de sus parámetros con el fin de mejorar las métricas de rendimiento hasta llegar a aquellas que son satisfactorias.
-	`Gestión de Recursos Máquina` --> Esta etapa corresponde a listar o mapear todos los recursos necesarios para el modelo de ML, en muchas ocasiones, se necesitan recursos pesados en términos de CPU, la memoria y almacenamiento, además de que el entrenamiento de modelos consume dinero y tiempo.
-	`Herramienta de Análisis` --> Decidir como medir el rendimiento del modelo, sus errores, la pérdida, el sobreajuste, etc.
-	`Herramienta para la Gestión del Proyecto` --> Como es que se va a mantener un registro de los datos, las features utilizadas, el código y los recursos.
-	`Infraestructura de despliegue` --> Una vez el modelo es desarrollado, probado y esta listo, se debe desplegar en un sitio donde todos los usuarios tengan acceso, en su mayoría, son desplegados en la nube [AWS, Azure, etc].
-	`Monitoreo `--> Se debe de emplear un sistema de monitoreo después del despliegue para garantizar que todo este funcionado, este sistema deberá de coleccionar los logs del modelo, un registro de sus usuarios y un registro de las predicciones.

## <font color= #ac84bd> **Niveles de las MLOps** </font>
La madurez de un proceso de ML suele clasificarse en uno de tres niveles [En ocasiones pueden ser más, pero en general suelen rondar los 3], dependiendo de cuánto nivel de automatización existe en el flujo de trabajo:
-	`Nivel 0: Todo es manual` --> En esta etapa, el equipo que desarrolla el modelo esta desconectado del equipo encargado de ponerlo en producción, y cada paso del proceso, desde la preparación de datos hasta el despliegue y monitoreo, no se ejecuta ningún tipo o sistema de automatización. No hay consideraciones de CI [Integración continua] /CD [Despliegue continuo] para los modelos de ML con el resto del código de la aplicación. Del mismo modo, no se monitorea activamente el rendimiento.
-	`Nivel 1: Pipeline de ML automatizado` --> El nivel 1 de las MLOps consiste en entrenar el modelo de forma continua mediante la automatización. Con el pipeline automatizado se incorporan nuevos datos para el entrenamiento continuo [CI], lo cual permite que el modelo acceda a información mas relevante para las predicciones.
-	`Nivel 2: Sistema CI/CD automatizado` --> Las actualizaciones al modelo de ML son rápidas y confiables, el modelo se entrena con nuevos datos a diario y las actualizaciones se despliegan en miles de servidores simultáneamente. El nivel 2 de MLOps es para las organizaciones que desean experimentar más y crear con frecuencia modelos nuevos que requieran entrenamiento continuo.

# <font color= #c499b7> **Bibliografía** </font>
<font color= #bbc28d> **Verde** </font>: https://towardsdatascience.com/a-gentle-introduction-to-mlops-7d64a3e890ff

<font color= #6c9fab> **Azul** </font>: https://aws.amazon.com/es/what-is/mlops/ 

<font color= #ac84bd> **Morado** </font>: https://www.redhat.com/en/topics/ai/what-is-mlops 
