## Configuraciones comunes para un ambiente de `MLflow Tracking`.
![](https://mlflow.org/docs/latest/_images/tracking-setup-overview.png)

### Escenario 2
```python
# set mlflow tracking uri
import mlflow
mlflow.set_tracking_uri('sqlite:///mlflow.db')
```

### Escenario 3
MLFlow remoto

```python
import mlflow

mlflow.set_tracking_uri('url/remote/server')
```


## `MLflow`: Beneficios
* El `Tracking server` puede ser fácilmente desplegado en la nube
* Compartir experimentos con otros Data Scientists
* Colaborar con otros para construir y desplegar modelos
* Dar más visibilidad de los esfuerzos del equipo de Data Science.

## `MLflow`: Problemas cuando se ejecutan servidores remotos compartidos
* Seguridad:
    * Restringir el acceso al server (por ejemplo a través de una VPN)
* Isolation:
    * Definir un estándar para nombrar experimentos, modelos y un conjunto de tags predeterminados.
    * Restringir el acceso a los artefactos  

## `MLflow`: Limitaciones
* **Autenticación y Usuarios:** La versión open source de `MLflow` no provee ningún tipo de autenticación
* **Versionamiento de datos** 
    * Para asegurar total reproducibilidad, necesitamos versionar los datos que se usan para entrenar el modelo.
    * `MLflow` no provee una solución para eso, pero hay maneras de mitigarlo
* **Monitoreo del modelo y datos:** Veremos la herramienta adecuada para este fin 

# DagsHub
 <div style="text-align:center">
    <img src="https://user-images.githubusercontent.com/611655/181510038-e38f4001-c304-411e-8f45-f71554eb9763.png" alt="DagsHub Logo">
</div>

## Introducción:
DagsHub es una plataforma revolucionaria que se describe como el "GitHub para el aprendizaje automático". Permite a los científicos de datos y desarrolladores de aprendizaje automático gestionar y colaborar en sus proyectos de manera eficiente, asegurando la reproducibilidad y el control de versiones.

## Características Clave:
1. **Control de Versiones**: Realiza un seguimiento de los cambios en los datos, el código y los modelos, garantizando un historial completo de tu proyecto de aprendizaje automático.
2. **Colaboración**: Facilita la colaboración dentro de los equipos al permitir que varios usuarios trabajen en el mismo proyecto manteniendo el historial de versiones.
3. **Versionado de Datos**: Realiza un seguimiento de las versiones de los datos, lo que facilita la reproducción de experimentos y el intercambio de conjuntos de datos.
4. **Reproducibilidad**: Asegura que los experimentos se puedan replicar con el mismo código, datos y entorno.
5. **Interfaz Web**: Ofrece una interfaz web intuitiva para organizar y gestionar proyectos de aprendizaje automático.
6. **Repositorios Públicos y Privados**: Ofrece tanto repositorios públicos como privados para compartir proyectos de manera abierta o segura.
7. **Seguimiento de Experimentos**: Registra todos los detalles de los experimentos de aprendizaje automático, lo que facilita el análisis y la comparación de resultados.
8. **Integración**: Se integra fácilmente con herramientas y formatos de código abierto populares, como Jupyter notebooks y Git.
9. **Organización de Proyectos**: Proporciona herramientas para mantener estructurado y bien documentado tu proyecto de aprendizaje automático.


## Dagshub

1. Creamos una cuenta [aquí](https://dagshub.com/user/sign_up). Se puede asociar con la cuenta de GitHub.
2. Cambiar contraseña.
3. Crear un primer repositorio.

## Actividad
Vamos a prepara el ambiente de trabajo para la siguiente clase:

1. Creamos un repositorio en `Github` llamado `nyc-taxi-time-prediction`
2. Vinculamos el repositorio a nuestra cuenta de `Dagshub`
3. Clonamos el repositorio de `Github` en nuestro local
4. Creamos un ambiente virtual
5. Crear una branch `experiments`
6. Crear un directorio `experiments` en la carpeta raíz del proyecto
7. Crer un `jupyter-notebook` dentro de dicho directorio con el nombre `model_experiments.ipynb`

### Usando los modelos...

In [None]:
import mlflow
mlflow.set_tracking_uri('https://dagshub.com/zapatacc/churn-model-app.mlflow')
logged_model = 'runs:/839d17c6a8004f5fa8f301a884268b6d/model'

# Load model as a PyFuncModel.
loaded_model = mlflow.pyfunc.load_model(logged_model)

# Predict on a Pandas DataFrame.
import pandas as pd
loaded_model.predict(pd.DataFrame(data))