# Machine Learning Operations con Python

Lo que hay que saber para desarrollar apps de machine learning en python que funcionen en ambientes de produccion.

## Explicacion de instaladores, directorios virtuales y manejadores de librerias
- [An unbiased evaluation of environment management and packaging tools](https://alpopkes.com/posts/python/packaging_tools/)
- [Video](https://www.youtube.com/watch?v=sxN-Iu-okdo)


### Directorios Virtuales (Virtual Environments)

Permiten crear directorios virtuales donde podemos instalar las librerias necesarias para un proyecto y que no generen conflicto con otras librerias de otros proyectos siempre que estos se encuentren en otros directorios virtuales.

#### [venv](https://docs.python.org/3/library/venv.html)

Comandos:
- `python -m venv <venv_path>`: crea el directorio virtual. ej:`python -m venv /mi_proyecto`
- `source <venv_path>/bin/activate`: activa el directorio virtual. ej:`source /mi_proyecto/bin/activate`
- `deactivate`: desactiva el directorio virtual

#### [virtualenv](https://virtualenv.pypa.io/en/latest/)

Comandos:
- `virtualenv <venv_path>`: crea el directorio virtual. ej:`virtualenv /mi_proyecto`
- `source <venv_path>/bin/activate`: activa el directorio virtual. ej:`source /mi_proyecto/bin/activate`
- `deactivate`: desactiva el directorio virtual

### Versiones de Python


Estos permiten instalar distintas versiones de python en un mismo ordenador sin que haya conflictos y permite cambiar de version en version segun se necesite

#### [pyenv](https://github.com/pyenv/pyenv)

[Comandos](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md):
- `pyenv install -l`: muestra una lista de las versiones de python instaladas
- [`pyenv install 3.10.4`]((https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-install)): instala una version especifica (3.10.4 en este caso)
- [`pyenv shell <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-shell):selecciona la version de python para la sesion de shell actual
- [`pyenv local <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-local): selecciona la version de python para el directorio actual
- [`pyenv global <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-shell): selecciona la version de python globalmente para el usuario actual

### Administradores de Librerias

#### [pip](https://pip.pypa.io/en/stable/)

pip es quizas el administrador de librerias mas conocido por los usuarios de python ya que puede instalar cualquier libreria del ecosistema [pypi que provee mas de 500k librerias](https://pypi.org/)

Comandos:

- [`pip install SomePackage`](https://pip.pypa.io/en/stable/user_guide/#installing-packages): instala la ultima version de la libreria SomePackage
- [`pip install SomePackage==1.0.4`](https://pip.pypa.io/en/stable/user_guide/#installing-packages): instala la version especificada de la libreria SomePackage
- [`pip uninstall SomePackage`](https://pip.pypa.io/en/stable/user_guide/#uninstalling-packages): desintala la libreria SomePackage


### Todo en uno

Son programas que permiten realizar todas las funciones mencionadas anteriormente y mas. El mas conocido es Conda que permite crear directorios virtuales y ademas posee su propio instalador y ecosistema de librerias. Poetry y Rye estan ganando popularidad y Pixi es similar a Poetry pero incluye tambien el ecosistema de Conda. Como profesor recomiendo utilizar Poetry o Rye ya que son mas modernos y he visto a Conda generar muchos problemas, en caso de querer utilizar el ecosistema Conda 


#### [Poetry](https://python-poetry.org/)

[Comandos](https://python-poetry.org/docs/basic-usage/):

- [`poetry new poetry-demo`](): crea un nuevo proyecto y su directorio virtual
- [`poetry add numpy`](): agrega una libreria al proyecto
- [`poetry install`](): instala las librerias
- [`poetry run python your_script.py`](): ejecuta el script dentro del directorio virtual
- [`poetry shell`](): activa el directorio virtual
- [`deactivate`](): desactiva el directorio virtual


#### [Rye](https://rye.astral.sh/)

[Comandos](https://rye.astral.sh/guide/basics/):

- [`rye init my-project`](): crea un nuevo proyecto, luego ingresamos con `cd my-project`
- [`rye init --script my-project`](): crea un nuevo proyecto ejecutable, luego ingresamos con `cd my-project`
- [`rye pin 3.10`](): establece la version de python
- [`rye sync`](): crea el directorio virtual y escribe el lock file
- [`rye add "flask>=2.0"`](): agrega una libreria y `rye sync` la instala
- [`rye remove flask`](): elimina una libreria
- [`rye run my-proyect`](): ejecuta el proyecto dentro del directorio virtual
- [`rye run jupyter lab`](): ejecuta ejecutables dentro del directorio virtual
- [`source ./bin/activate`](): activa el directorio virtual
- [`deactivate`](): desactiva el directorio virtual

#### [Pixi](https://prefix.dev/)

[Comandos](https://pixi.sh/latest/basic_usage/):

- [`pixi init pixi-hello-world`](): crea un proyecto nuevo, luego ingresamos con `cd pixi-hello-world`
- [`pixi add numpy`](): instala librerias desde conda
- [`pixi add --pypi numpy`](): instala librerias desde pypi
- [`pixi run jupyter lab`](): ejecuta codigo dentro del directorio virtual del proyecto

#### [Conda](https://docs.conda.io/en/latest/)

[Comandos](https://docs.conda.io/projects/conda/en/stable/commands/index.html#conda-vs-pip-vs-virtualenv-commands):

- [`conda create --name $ENVIRONMENT_NAME python`](https://docs.conda.io/projects/conda/en/stable/commands/env/create.html): crea un directorio virtual
- [`conda activate $ENVIRONMENT_NAME`](): activa el directorio virtual
- [`conda deactivate`](): desactiva el directorio virtual
- [`conda install $PACKAGE_NAME`](https://docs.conda.io/projects/conda/en/stable/commands/install.html): instala una libreria
- [`conda remove --name $ENVIRONMENT_NAME $PACKAGE_NAME`](): elimina una libreria


## Git

- [Tutorial](https://colab.research.google.com/drive/11EPXUjESxiT1RV6p1pkeKYS8PJFkRNpk)

## Testing

- https://colab.research.google.com/drive/1Rmk_5jEhuefqFavpDLtteGqE8-R1qmZv
- [Unit testing](https://docs.python.org/3/library/unittest.html)
- [PyTest](https://github.com/pytest-dev/pytest/)
- [Integracion continua con GitHub Actions](https://docs.github.com/es/enterprise-cloud@latest/actions/automating-builds-and-tests/building-and-testing-python)
- [Integracion continua con GitHub Actions En ingles](https://docs.github.com/en/actions/automating-builds-and-tests/building-and-testing-python)
- [Testing con Rye](https://rye.astral.sh/guide/commands/test/)

## Docker

- https://www.docker.com/play-with-docker/
- https://training.play-with-docker.com/
- https://labs.leaningtech.com/blog/mini-webvm-your-linux-box-from-dockerfile-via-wasm

Optional:
- https://github.com/indigo-dc/udocker
- https://anvil.works/learn/tutorials/google-colab-web-service
- https://biplobsd.me/blogs/view/run-swirl-open-source-search-engine-on-google-colab.md

## ETL Pipelines y Frameworks

- https://news.ycombinator.com/item?id=40723356
- https://amphi.ai/
- https://dlthub.com/
- https://hub.meltano.com/
- https://www.definite.app/

# Otros enlaces de interes:

- https://harvard-edge.github.io/cs249r_book/