# Gestión de dependencia

Los objetivos de aprendizaje son:

1. Motivación
2. Requisitos previos.
    - Instalación.
3. Conceptos Básicos de Poetry.
    - Crear un nuevo projecto.
    - Estructura de proyecto.
    - Archivo `pyproject.toml`.
4. Trabajar con Poetry.
    - Usar entornos virtuales.
    - Gestión de dependencias.
    - Instalar paquetes con Poetry.
5. Gestionar el archivo `poetry.lock`.
    - Hacer Pin a las Dependencias.
    - Instalar dependencias desde poetry.lock.
    - Actualizar dependencias.
    
    
## Motivación

Python cuenta con un amplio catálogo de paquetes desarrollados por terceros que sirven para hacer una gran cantidad de cosas, por ejemplo:

- Pandas
    - [Sitio oficial](https://pandas.pydata.org/)
    - [Código fuente](https://github.com/pandas-dev/pandas)
- PyTorch
    - [Sitio oficial](https://pytorch.org/)
    - [Código fuente](https://github.com/pytorch/pytorch)
- Scikit-Learn
    - [Sitio oficial](https://scikit-learn.org/stable/)
    - [Código fuente](https://github.com/scikit-learn/scikit-learn)
- FastAPI
    - [Sitio oficial](https://fastapi.tiangolo.com/)
    - [Código fuente](https://github.com/tiangolo/fastapi)
- SQLAlchemy
    - [Sitio oficial](https://www.sqlalchemy.org/)
    - [Código fuente](https://github.com/sqlalchemy/sqlalchemy)
- SASPy
    - [Sitio oficial](https://developer.sas.com/guides/saspy.html)
    - [Código fuente](https://github.com/sassoftware/saspy)
- Seaborn
    - [Sitio oficial](https://seaborn.pydata.org/)
    - [Código fuente](https://github.com/mwaskom/seaborn)
    

Las dependencias nos ayudan a **Programar a un nivel más alto de abstracción**, nos permiten  escribir programas en menos tiempo, i.e. evitar reinventar la rueda y ofrecer software de Python de mayor calidad, más rápido. 


Pero cuando un proyecto depende de paquetes externos, debemos asegurarnos de que se está utilizando la versión correcta de cada paquete. Después de una actualización, es posible que un paquete no funcione como lo hacía antes. 


Es aquí en donde un gestor de dependencias como Poetry se vuelve fundemantal para especificar, instalar y resolver paquetes externos en sus proyectos.

De esta manera, podremos estar seguro de que siempre trabajamos con la versión de dependencia correcta en cada entorno.


## Requisitos previos.


### Instalación.

Para usar Poetry en la línea de comandos, debemos instalarlo en el sistema operativo.
También es posible instalarlo en un entorno virtual usando pip. Pero no es óptimo porque las dependencias de Poetry podrían entrar en conflicto con la de nuestro proyecto.


En este enlace se puede encontrar una [guía paso a paso para Windows](https://www.dropbox.com/home/Curso%20Python%202023/01%20Set-up?preview=03+Github+e+Instalaci%C3%B3n+Poetry+.pdf).


## Conceptos Básicos de Poetry.

### Crear un nuevo proyecto.

Se puede crear un nuevo proyecto con `Poetry` utilizando el comando `new` seguido del nombre de proyecto como argumento. 

Por ejemplo: 


In [1]:
!poetry new cac-poetry

Created package [34mcac_poetry[39m in [34mcac-poetry[39m


Al ejecutar `poetry new cac-poetry` se creará una nueva carpeta llamada cac-poetry/ con la siguiente estructura:

In [2]:
!tree

[1;36m.[0m
├── [31m01 Gestión de dependencia.ipynb[0m
└── [1;36mcac-poetry[0m
    ├── README.md
    ├── [1;36mcac_poetry[0m
    │   └── __init__.py
    ├── pyproject.toml
    └── [1;36mtests[0m
        └── __init__.py

4 directories, 5 files


Poetry normaliza automáticamente los nombres de los paquetes. Transformó el guión (-) en el nombre del proyecto por guión bajo (_) en el nombre de la carpeta de cac_poetry/. 

De lo contrario, el nombre no estaría permitido en Python, por lo que no podríamos importarlo como un módulo. 


podemos usar la opción `--name` para usar otro nombre:

```` shell
poetry new cac-poetry --name cac_con_poetry
cd cac-poetry
````

### Estructura de proyecto.

La carpeta `cac-poetry/` tiene los siguientes elementos:

- README.rst: Archivo que usaremos para describir el propósito general de nuestro proyecto, así como su instalación y uso apropiado.

- Subcarpeta `cac_poetry`: Carpeta que contendrá el código fuente de nuestro proyecto
    - `__init__.py`: Archivo de inicialización con la versión del proyecto
    
- pyproject.toml: Es un archivo de configuración definido en a PEP 518, veremos más adelante cómo funciona.

- Subcarpeta `tests`: Esta carpeta contendrá la librería de pruebas, más adelante en el curso veremos a detalle cómo y por qué es importante.
    - `__init__.py`: Archivo de inicialización de la librería de pruebas
    - `test_cac_poetry.py`: Módulo general de test que comprueba la versión del proyecto. 
    

### Archivo `pyproject.toml`.

La extensión `*.toml` se usa para archivos de configuración y es un acrónimo de "Tom's Obvious, Minimal Language", Tom Preston-Werner lo creó.

El archivo `pyproject.toml` tiene el siguiente aspecto:

````toml
[tool.poetry]
name = "cac-poetry"
version = "0.1.0"
description = ""
authors = ["HeberTU <heber.trj.urt@gmail.com>"]

[tool.poetry.dependencies]
python = "^3.8"

[tool.poetry.dev-dependencies]
pytest = "^5.2"

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"

````

El archivo `pyproject.toml` está dividido en 4 secciones y contienen instrucciones que herramientas como `Poetry` utilizan para la gestión de dependencias o creación de rutinas.

Si el nombre de una sección es específico para una herramienta, e.g. `Poetry` debe tener el prefijo `tool.`. En este caso, solo hay tool.poetry. Pero también existen otras opciones como \[tool.pytest.ini_options\] para las [configuraciones de pytest](https://docs.pytest.org/en/6.2.x/customize.html).


- **Sección \[tool.poetry\]**: Almacena información general sobre su proyecto.
<br>

    - name: el nombre del paquete
    - version: la versión del paquete, idealmente siguiendo el control de [versiones semántico](https://www.geeksforgeeks.org/introduction-semantic-versioning/)
    - descripción: una breve descripción del paquete
    - autores: Lista de autores
<br>


- **Secciones \[tool.poetry.dependencies\] y \[tool.poetry.dev-dependencies\]**: Indican las dependencias del paquete y desarrollo.
<br>


- **Sección \[build-system\]**: Configuración de compilación, no es específico de una herramienta y por tanto no tiene un prefijo. 
<br>

    - requires: una lista de dependencias que se requieren para construir el paquete.
    - build-backend: El objeto de Python utilizado para realizar el proceso de compilación

Con el tiempo agregaremos más información de configuración, e.g. \[tool.poetry.dependencies\] y \[tool.poetry.dev-dependencies\] incluirán las dependencia que vayamos agregando.


## Trabajar con Poetry.


### Usar entornos virtuales.

Cuando iniciamos un nuevo proyecto de Python, es una buena práctica crear un entorno virtual. De lo contrario, podemos crear conflictos entre las dependencias de nuestros proyectos.

Trabajar con entornos virtuales es una de las funciones principales de Poetry y nunca interferirá con su instalación global de Python.

De inicio `Poetry` no crea ningún entorno virtual, podemos confirmarlo con el siguiente comando que enumera los entornos vinculados al proyecto actual:




In [3]:
!cd cac-poetry && poetry env list

Por ahora no debería haber ningún output.

La manera más fácil de crear un entorno virtual con Poetry es ejecutando dentro de la carpeta de nuestro proyecto el comando:

``` shell
poetry install

```


Con `install` Poetry verifica el archivo `pyproject.toml` en busca de dependencias, luego:

1. Crea un entorno virtual en caso de que no exista
2. Resuelve las dependencias. Encontrar la combinación de versiones que satisface todos los requerimientos.   
3. Instala las dependencias 

El siguiente paso es inicializar el entorno virtual mediante alguno de los siguietnes comandos 

Windows:

``` shell
.venv\Scripts\activate.bat
```

Unix:

```shell
source .venv/bin/activate
```





Si se activó el entorno deberíamos ver el prefijo `(.venv)` en nuestra consola.


### Gestión de dependencias.

Un elemento clave de Poetry es la gestión de dependencias. Por ahora hay dos dependencias declaradas: 

- Python
- pytest: Con pytest como dependencia, Poetry puede ejecutar sus pruebas inmediatamente después de la instalación

````toml
[tool.poetry.dependencies]
python = "^3.8"

[tool.poetry.dev-dependencies]
pytest = "^5.2"
````

> **Nota**: El símbolo caret (^) delante de 5.2 significa que Poetry puede instalar cualquier versión tanto la versión 5.2 como cualquier poster 5.2 y que sea anterior a 6.0.

### Instalar paquetes con Poetry.

Poetry usa por debajo `pip` para instalar paquetes, y añade un motor de resolución de dependencias por arriba. Las dependencias se encuentran centralizadas en [PyPi](https://pypi.org/), un repositorio de software.


Si queremos instalar la versión más reciente de un paquete externo, e.g. `requests`, podemos usar el siguiente comando:


``` shell
 poetry add requests
```

Podemos usar restricciones de versión como 

- <= 2.1 
- == 2.24 

``` shell
 poetry add requests <= 2.1 
```

No todas las dependencias de nuestro proyecto son necesarias si no estamos desarrollando el proyecto, por ejemplo:

- [`pytest`](https://docs.pytest.org/en/7.2.x/) Sólo la usaremos cuando desarrollemos e integremos nuevas características. 
- [`black`](https://github.com/psf/black) Es una herramienta que formatea nuestro código para que se vea mejor.
- [`sphinx`](https://www.sphinx-doc.org/en/master/) puede usarse para generar documentaciín atomáticamente.
- [`mypy`](https://mypy-lang.org/) es una herramienta de análisi estático que funciona muy bien con las anotaciones.

Para decirle explícitamente a Poetry que un paquete es una dependencia de desarrollo, usamos la opción `--dev`, también podemos usar su versión abreviada `-D`.

``` shell
 poetry add black --dev
```


Al ejecutar todos esos comandos, Poetry ha hecho algo en el *background* por nosotros:


````toml
[tool.poetry.dependencies]
python = "^3.8"
requests = "^2.28.2"

[tool.poetry.dev-dependencies]
pytest = "^5.2"
black = "^22.12.0"
````

## Gestionar el archivo `poetry.lock`

Además de actualizar el archivo `pyproject.toml`, Poetry también creó un nuevo archivo llamado `poetry.lock`. 

> `poetry.lock` contiene un seguimiento de todos los paquetes y las versiones exactas que está utilizando en el proyecto.

Cuando ejecuta el comando `poetry add`, Poetry actualiza automáticamente `pyproject.toml` y fija las versiones resueltas en el archivo `poet.lock`.

Pero también es posible modificar manualmente el archivo `pyproject.toml` y después bloquearlas después hacer `poetry lock`.

### Hacer Pin a las Dependencias.

Supongamos que queremos hacer [webscraping](https://es.wikipedia.org/wiki/Web_scraping), para ello podríamos usar [`beautifulsoup4`](https://www.crummy.com/software/BeautifulSoup/bs4/doc/)

Podemos añadir manualmente el paquete al archivo `pyproject.toml`:

````toml
[tool.poetry.dependencies]
python = "^3.8"
requests = "^2.28.2"
beautifulsoup4 = "4.10.0"
````

Cuando agregamos un requisito al archivo `pyproject.toml`, éste no se instala inmediatamente. Para instalarlo: 

- Mientras no haya un archivo `poetry.lock` en el proyecto, podemos ejecutar `poetry install` después de agregar manualmente las dependencias, porque Poetry busca primero un archivo `poetry.lock`, si no lo encuentra, Poetry resuelve las dependencias desde `pyproject.toml`.
<br>

- Tan pronto como exusta archivo `poetry.lock`, Poetry lo usará instalar las dependencias. Si ejecutamos `poetry install` se generaría un error porque los archivos no están sincronizados:

<br>


Para resolver este error deberemos hacer pin a las dependencias agregadas manualmente:

``` shell

poetry lock

```


Poetry procesará todas las dependencias en el archivo `pyproject.toml` y las actualizará el archivo `poetry.lock`.

> `poetry lock` también actualiza las dependencias existentes, para evitar esto podemos ejecutar `poetry lock --no-update`


### Instalar dependencias desde poetry.lock.

Ya hemos sincronizado los archivos `pyproject.toml` y `poetry.lock`, pero aún no se ha instalado `beautifulsoup4`. Para instalar el paquete tendremos que usar:

```shell
poetry install
```


### Actualizar dependencias.

Poetry ofrece dos de actualización:

- Actualizar una dependencia dentro de las restricciones de su versión, e.g. `"^5.2"` permitiría ir de `"5.2"` a `"5.4"`
<br>

- Actualizar una dependencia fuera de las restricciones de su versión.


Para el primer caso podemos usar

```` shell
poetry update requests
`````

El comando hará lo siguiente:

- Buscará las restricciones de versión dentro del archivo `pyproject.toml`
- Actualziará el `requests` junto con sus dependencias manteniendo las restricciones
- Actualizará el archivo `poetry.lock `. 


Si nos interesa el segundo escenario podemos ejecutar:

````shell
poetry add requests@latest
````

Cuando añadimo el tag `@latest` el comando hará lo siguiente:

- Buscará la versión más nueva del paquete `requests`.
- Verificará que no haya conflictos con el resto de versiones de los otros paquetes.
- Actualizará el archivo `pyproject.toml`.
- Instalará la versión que encontró del paquete `requests`.