# Package Managers

Python se ha convertido en el lenguaje mas utilizado para data science y machine learning, su fortaleza radica en que existe un repositorio con mas de medio millon de librerias (y sigue creciendo) para que podamos descargar y empezar a usar. Esta beneficio de python tambien tiene sus contras y la principal contra es que las distintas librerias dependen de una version especifica de otras librerias y a su vez tambien de una version especifica de python por lo cual si quiero que mi proyecto funcione correctamente tengo que instalar las versiones adecuadas de python y de cada libreria y que no entren en conflicto con otras versiones de python o librerias que ya tengo instaladas en mi ordenador. Para resolver este problema existen las herramientas que veremos a continuacion.

## Directorios Virtuales, Instaladores y Manejadores de Librerias


### Directorios Virtuales (Virtual Environments)

Permiten crear directorios virtuales donde podemos instalar las librerias necesarias para un proyecto y que no generen conflicto con otras librerias de otros proyectos siempre que estos se encuentren en otros directorios virtuales.

#### [venv](https://docs.python.org/3/library/venv.html)

Esta herramienta ya viene incluida con python. Permite crear y activar y desactivar directorios virtuales. Una vez activados todo lo que instalemos alli quedara aislado del resto de las instalaciones que realicemos en el ordenador.

Comandos:
- `python -m venv <venv_path>`: crea el directorio virtual. ej:`python -m venv /mi_proyecto`
- `source <venv_path>/bin/activate`: activa el directorio virtual. ej:`source /mi_proyecto/bin/activate`
- `deactivate`: desactiva el directorio virtual

#### [virtualenv](https://virtualenv.pypa.io/en/latest/)

Realiza lo mismo que venv y ademas tiene mas funcionalidades, de hecho venv nace a partir de virtualenv. Puedes ver las diferencias entre ambos [aqui](https://virtualenv.pypa.io/en/latest/)

Comandos:
- `virtualenv <venv_path>`: crea el directorio virtual. ej:`virtualenv /mi_proyecto`
- `source <venv_path>/bin/activate`: activa el directorio virtual. ej:`source /mi_proyecto/bin/activate`
- `deactivate`: desactiva el directorio virtual

### Versiones de Python

#### [pyenv](https://github.com/pyenv/pyenv)

Esta herramienta permite instalar distintas versiones de python en un mismo ordenador sin que haya conflictos y permite cambiar de version en version segun se necesite

[Comandos](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md):
- `pyenv install -l`: muestra una lista de las versiones de python instaladas
- [`pyenv install 3.10.4`]((https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-install)): instala una version especifica (3.10.4 en este caso)
- [`pyenv shell <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-shell):selecciona la version de python para la sesion de shell actual
- [`pyenv local <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-local): selecciona la version de python para el directorio actual
- [`pyenv global <version>`](https://github.com/pyenv/pyenv/blob/master/COMMANDS.md#pyenv-shell): selecciona la version de python globalmente para el usuario actual

### Administradores de Librerias

#### [pip](https://pip.pypa.io/en/stable/)

pip es quizas el administrador de librerias mas conocido por los usuarios de python ya que puede instalar cualquier libreria del ecosistema [pypi que provee mas de 500k librerias](https://pypi.org/)

Comandos:

- [`pip install SomePackage`](https://pip.pypa.io/en/stable/user_guide/#installing-packages): instala la ultima version de la libreria SomePackage
- [`pip install SomePackage==1.0.4`](https://pip.pypa.io/en/stable/user_guide/#installing-packages): instala la version especificada de la libreria SomePackage
- [`pip uninstall SomePackage`](https://pip.pypa.io/en/stable/user_guide/#uninstalling-packages): desintala la libreria SomePackage


### Todo en uno

Son programas que permiten realizar todas las funciones mencionadas anteriormente y mas. El mas conocido es Conda que permite crear directorios virtuales y ademas posee su propio instalador y ecosistema de librerias. Poetry y Rye estan ganando popularidad y Pixi es similar a Poetry pero incluye tambien el ecosistema de Conda. Como profesor recomiendo utilizar Poetry o Rye ya que son mas modernos y he visto a Conda generar muchos problemas, en caso de querer utilizar el ecosistema Conda me inclinaria por utilizar Pixi.


#### [Poetry](https://python-poetry.org/)

[Comandos](https://python-poetry.org/docs/basic-usage/):

- [`poetry new poetry-demo`](): crea un nuevo proyecto y su directorio virtual
- [`poetry add numpy`](): agrega una libreria al proyecto
- [`poetry install`](): instala las librerias
- [`poetry run python your_script.py`](): ejecuta el script dentro del directorio virtual
- [`poetry shell`](): activa el directorio virtual
- [`deactivate`](): desactiva el directorio virtual


#### [Rye](https://rye.astral.sh/)

[Comandos](https://rye.astral.sh/guide/basics/):

- [`rye init my-project`](): crea un nuevo proyecto, luego ingresamos con `cd my-project`
- [`rye init --script my-project`](): crea un nuevo proyecto ejecutable, luego ingresamos con `cd my-project`
- [`rye pin 3.10`](): establece la version de python
- [`rye sync`](): crea el directorio virtual y escribe el lock file
- [`rye add "flask>=2.0"`](): agrega una libreria y `rye sync` la instala
- [`rye remove flask`](): elimina una libreria
- [`rye run my-proyect`](): ejecuta el proyecto dentro del directorio virtual
- [`rye run jupyter lab`](): ejecuta ejecutables dentro del directorio virtual
- [`source ./bin/activate`](): activa el directorio virtual
- [`deactivate`](): desactiva el directorio virtual

#### [Pixi](https://prefix.dev/)

[Comandos](https://pixi.sh/latest/basic_usage/):

- [`pixi init pixi-hello-world`](): crea un proyecto nuevo, luego ingresamos con `cd pixi-hello-world`
- [`pixi add numpy`](): instala librerias desde conda
- [`pixi add --pypi numpy`](): instala librerias desde pypi
- [`pixi run jupyter lab`](): ejecuta codigo dentro del directorio virtual del proyecto

#### [Conda](https://docs.conda.io/en/latest/)

[Comandos](https://docs.conda.io/projects/conda/en/stable/commands/index.html#conda-vs-pip-vs-virtualenv-commands):

- [`conda create --name $ENVIRONMENT_NAME python`](https://docs.conda.io/projects/conda/en/stable/commands/env/create.html): crea un directorio virtual
- [`conda activate $ENVIRONMENT_NAME`](): activa el directorio virtual
- [`conda deactivate`](): desactiva el directorio virtual
- [`conda install $PACKAGE_NAME`](https://docs.conda.io/projects/conda/en/stable/commands/install.html): instala una libreria
- [`conda remove --name $ENVIRONMENT_NAME $PACKAGE_NAME`](): elimina una libreria


## Ejercicios:

Para realizar los ejercicios necesitamos ejecutar comandos de linux para ello podemos utilizar la consola de shell o terminal que se ve de la siguiente manera en nuestro ordenador:

<div style="text-align:center">
<img src="./img/shell.png" alt="consola shell" width="500"/>
</div>

Como en este curso trabajamos todo online en las maquinas virtuales que provee google a traves de [google colab](https://research.google.com/colaboratory/intl/es/faq.html) utilizaremos la instruccion `%%bash` al inicio de la celda para decir que el codigo siguiente no debe ser interpretado como codigo de python sino que debe ser interpretado como comandos de linux. De esta manera podemos utilizar las celdas de codigo como si fueran nuestra consola o terminal del ordenador.

In [1]:
%%bash

ls

0_intro.ipynb
1_package_managers.ipynb
2_functions_and_testing.ipynb
3_docker.ipynb
4_git.ipynb
5_etl_pipelines_frameworks.ipynb
[34mimg[m[m


Antes de empezar a usar las herramientas antes mencionadas veamos algunos comandos utiles de linux:

### Useful commands

#### Directories

- `pwd` : tells you where you currently are (the path)
- `mkdir` _dirname_ : create a new directory
- `cd`  _dirname_ : change directory

#### Files

- `ls` : list files
- `rm` _filename_ : remove a file
- `mv` _filename1_ _filename2_ : rename a file
- `diff` _filename1_ _filename2_ : compare two files
- `cat` _filename(s)_ : print file(s) contents
- `which` : shows path of a command
- `find [args]` : find files
- `echo` : write to standard output

In [4]:
%%bash

pwd

/Users/hernanamiune/Documents/freecodingtour/cursos/espanol/mlops


In [5]:
%%bash

cd img
pwd

/Users/hernanamiune/Documents/freecodingtour/cursos/espanol/mlops/img


In [6]:
%%bash

pwd

/Users/hernanamiune/Documents/freecodingtour/cursos/espanol/mlops


Si solamente queremos escribir una sola linea de un comando de linux tambien podemos utilizar las siguientes sintaxis:
1. `!pip install numpy`
2. `%pip install numpy`

## Referencias:

- [An unbiased evaluation of environment management and packaging tools](https://alpopkes.com/posts/python/packaging_tools/)
- [Video](https://www.youtube.com/watch?v=sxN-Iu-okdo)