# Módulos y paquete

Los objetivos de aprendizaje son:

1. Motivación
2. Módulos de Python 
3. La ruta de búsqueda de módulos
4. La cláusula `import`
5. La función `dir()`
6. Ejecutar módulos como scripts
7. Paquetes de Python
9. Inicializar un paquete

## Motivación

Los módulo y paquetes de Python son dos mecanismos que fecilitan la **programación modular**


La **programación modular** se refiere al proceso de dividir una tarea de programación grande y difícil de manejar en subtareas más pequeños y más manejables, i.e. módulos.

Las ventajas son:

- **Simplicidad**: En lugar de enfocarnos en todo el problema en cuestión, un módulo generalmente se enfoca en una porción relativamente pequeña del problema.
<br>

- **Mantenimiento**: Si los módulos se escriben de manera que se minimice la interdependencia, hay menos probabilidad de que las modificaciones a un solo módulo tengan un impacto en otras partes del programa. 
<br>

- **Reutilización**: la funcionalidad definida en un solo módulo puede reutilizarse fácilmente (abstracción) por otras partes de la aplicación. Esto elimina la necesidad de duplicar el código.
<br>

- **Scoping**: Los módulos suelen definir un `namepace` individual, lo que ayuda a evitar colisiones entre identificadores en diferentes áreas de un programa.
<br>


## Módulos de Python

Hay tres formas diferentes de definir un módulo en Python:

- Puede estar escrito en Python, e.g. `pandas`, `fastapi`, `torch`, etc.
<br>

- Un módulo puede escribirse en C y cargarse dinámicamente en el `run-time`, como el módulo `re` (regular expression).
<br>

- Los módulos *pre-construidos* (built-in) contenidos en el intérprete, como el módulo `fuctools`.

En los tres casos usamos la cláusula `import` para acceder a su contenido.

Nos centraremos en los del primer tipo, módulos que están escritos en Python. Dado que son muy sencillos de construir. 

 > Sólo necesitamos crear un archivo que contenga código Python y luego darle un nombre al archivo con una extensión `.py`.

Por ejemplo:

Lo siguiente es el cóntenido de un archivo llamado *modulo_test.py*
```` python
s = "String dentro de un módulo"

l = [100, 200, 300]

def func_modulo(name: str):
    print(f"Nombre dentro de una función de módulo {name}")

class Poliza:
    pass
````

Si ahora intentamos acceder a una de estas variables obtendremos un error del tipo `NameError`


In [1]:
s

NameError: name 's' is not defined

Podemos acceder a las vriables si importamos el módulo *modulo_test.py* 

In [2]:
import modulo_test

modulo_test.s

'String dentro de un módulo'

In [3]:
modulo_test

<module 'modulo_test' from '/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes/modulo_test.py'>

In [4]:
import os
os.getcwd()

'/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes'

## La ruta de búsqueda de módulos

¿Qué sucede cuando Python ejecuta el comando?

```` python
import modulo_test
````


El comando busca *modulo_test.py* en una lista de directorios ensamblados a partir de las siguientes fuentes:

- El directorio desde el que se ejecutó el comando o el directorio actual si el intérprete se ejecuta de forma interactiva (e.g. notebooks).
<br>

- La lista de directorios contenidos en la variable de entorno `PYTHONPATH`, si está configurada. En el caso de Windows será que que definimos en el `PATH`.
<br>

- Una lista de directorios configurada en el momento en que se instala Python.

Podemos acceder a la ruta de búsqueda desde python así:

In [5]:
import sys 
sys.path

['/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes',
 '/opt/homebrew/Cellar/python@3.11/3.11.6_1/Frameworks/Python.framework/Versions/3.11/lib/python311.zip',
 '/opt/homebrew/Cellar/python@3.11/3.11.6_1/Frameworks/Python.framework/Versions/3.11/lib/python3.11',
 '/opt/homebrew/Cellar/python@3.11/3.11.6_1/Frameworks/Python.framework/Versions/3.11/lib/python3.11/lib-dynload',
 '',
 '/Users/heber.trujillo/projects/curso-python-cac/.venv/lib/python3.11/site-packages']

Para poder encontrar y utilizar el móduulo tendremos que cumplir al menos uno de estos supuestos:


- Colocar *modulo_test.py* en el directorio donde se encuentra el script o notebook que estamos ejecutando. 
<br>

- Modificar la variable de entorno `PYTHONPATH` para que contenga el directorio donde se encuentra *modulo_test.py* antes de iniciar el intérprete de python, o colocar *modulo_test.py* en uno de los directorios ya contenidos en la variable `PYTHONPATH`
<br>
  
- Colocar *modulo_test.py* en uno de los directorios dependientes de la instalación, a los que podríamos o no tener acceso de escritura, según el sistema operativo.
<br>

- Colocar el archivo del módulo en cualquier directorio y luego modificar sys.path en tiempo de ejecución para que contenga ese directorio. Por ejemplo, colocar *modulo_test.py* en el directorio `/Users/heber.trujilloglovoapp.com/` y luego ejecutar:

````python
sys.path.append('/Users/heber.trujilloglovoapp.com/')
````

Una vez que se ha importado un módulo, podemos determinar su ubicación:

In [6]:
import modulo_test
modulo_test.__file__

'/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes/modulo_test.py'

In [7]:
import functools
functools.__file__

'/opt/homebrew/Cellar/python@3.11/3.11.6_1/Frameworks/Python.framework/Versions/3.11/lib/python3.11/functools.py'

In [8]:
import requests
requests.__file__

'/Users/heber.trujillo/projects/curso-python-cac/.venv/lib/python3.11/site-packages/requests/__init__.py'

## La cláusula `import`

El contenido de un módulo se pone a disposición de los usuarios mediante la cláusula `import`, que podemos usar de muchas formas.

### `import <module_name>`

La forma más simple es: 

```` python
import <module_name>
````

> **Nota**: De esta forma el contenido del módulo no es directamente accesible, cada módulo tiene su propio `namespace` que contiene a los objetos definidos en el módulo.

La cláusula `import <module_name>` solo coloca `<module_name>` en `namespace` `global`, los objetos del módulo quedan dentro del `local` `namespace` del `<module_name>`.

Los objetos serán accesibles mediante el prefijo `<module_name>.`.

In [9]:
import modulo_test


In [10]:
s

NameError: name 's' is not defined

In [11]:
modulo_test.s

'String dentro de un módulo'

### `from <module_name> import <name(s)>`

De manera alternativa podemos ocupar la cláusula `from` para importar objetos individuales del módulo `<module_name>` directamente al `global namespace`:

````python
from <module_name> import <name(s)>
````


In [12]:
from modulo_test import s

In [13]:
s

'String dentro de un módulo'

> **Nota**: Al usar esta forma de `import` podemos sobre-escribir variables dentro de nuestro `global namespace`

In [14]:
l = "No es una lista"
l

'No es una lista'

In [15]:
from modulo_test import l
l

[100, 200, 300]

>**Nota**: es posible importar todas las variables del módulo `<module_name>` con el comando `from <module_name> import *`, pero en general se considera una mala práctica.

### `from <module_name> import <name> as <alt_name>`

También es posible importar objetos individuales pero ingresarlos al `global namespace` con nombres alternativos:

In [16]:
from modulo_test import s as string_en_modulo

In [17]:
string_en_modulo

'String dentro de un módulo'

### `import <module_name> as <alt_name>``

También se puede importar un módulo completo con un nombre alternativo:

In [18]:
import modulo_test as mod_123

In [19]:
mod_123.s

'String dentro de un módulo'

## La función `dir()`

La función *pre-instalada* `dir()` devuelve una lista de nombres definidos en un `namespace`. Sin argumentos, produce una lista ordenada alfabéticamente de nombres en el `namespace` actual:

In [20]:
dir()[-10:]

['l',
 'mod_123',
 'modulo_test',
 'open',
 'os',
 'quit',
 'requests',
 's',
 'string_en_modulo',
 'sys']

Cuando pasamos como argumento el nombre de un módulo a `dir()` se enumeran los nombres definidos en el módulo:

In [21]:
dir(modulo_test)

['Poliza',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'func_modulo',
 'l',
 's']

## Ejecutar módulos como scripts

Cualquier archivo `.py` que contenga un módulo es esencialmente también un script de Python.

Por ejemplo:

Lo siguiente es el cóntenido de un archivo llamado *script_test.py*
```` python

def func_saludar(name: str):
    print(f"Hola {name}")

func_saludar(name="Heber")
````

Podemos ejecutar el script de la siguiente manera:

```` bash
python path/to/script_test.py
````

Como pudimos observar en la consola, se imprimió la llamada de la funció `func_saludar(name="Heber")`

¿Qué pasa si quremos importar el archivo *script_test.py* como módulo?

In [23]:
!python script_test.py

Hola Heber
__main__


In [24]:
import script_test

Hola Heber
script_test


In [25]:
script_test.__name__

'script_test'

Genera una impresión!

No es habitual que un módulo genere resultados cuando se importa.

> ¿No sería bueno poder distinguir entre cuándo se carga el archivo como un módulo y cuándo se ejecuta como un script independiente?

!Es posible!

Cuando se importa un archivo .py como módulo, Python fija el valor de la variable `__name__` como el nombre del módulo. Sin embargo, si un archivo se ejecuta como un script independiente, `__name__` toma el valor `'__main__'`. Podemos usar este hecho a nuestro favor.


Por ejemplo:

Lo siguiente es el cóntenido de un archivo llamado *script_test_2.py*
```` python
def func_saludar(name: str):
    print(f"Hola {name}")


if __name__ == '__main__':
    func_saludar(name="Heber")
````

In [27]:
import script_test_2

In [28]:
!python script_test_2.py

Hola Heber


## Paquetes de Python

Los paquetes permiten agrupar en una estructura jerárquica los módulos y los `namespaces` mediante la notación de puntos. De la misma manera que los módulos ayudan a evitar colisiones entre nombres de variables globales, los paquetes ayudan a evitar colisiones entre nombres de módulos.

Por ejemplo

Tenemos la siguiente estructura de módulos:

``` bash
paquete_test
│ 
├── api_modelo.py
├── base_datos.py
└── estimador.py
```

*base_datos.py*
```` python

class Conexion():
    def __init__(self, url: str):
            self.url = url
         
    

class BaseDatos():
    def __init__(self, conexion: Conexion):
            self.conexion = conexion

````

*api_modelo.py*
```` python

class APIMod():
    def __init__(self, url: str, port: int):
            self.url = url
            self.port = port

````


*estimador.py*
```` python
from typing import List

class Estimador():
    
    def predict(self, y: List[float])->List[float]:
        return [val*0.1 + 3 for val in y]
        
````

Dada esa estructura, si el directorio `paquete_test` reside en una ubicación de los directorios contenidos en `sys.path`, puedemos hacer referencia a los dos módulos con notación de punto:


In [29]:
import paquete_test.estimador

In [30]:
paquete_test.estimador

<module 'paquete_test.estimador' from '/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes/paquete_test/estimador.py'>

In [31]:
paquete_test.estimador.Estimador()

<paquete_test.estimador.Estimador at 0x114448390>

Técnicamente, también puedemos importar el paquete:

In [34]:
import paquete_test

Aunque esto es un comando de Python sintácticamente correcto, no es útil. No coloca ninguno de los módulos en `paquete_test` en el `global namespace`:

In [35]:
paquete_test.api_modelo

AttributeError: module 'paquete_test' has no attribute 'api_modelo'

Tendríamos que:

In [36]:
import paquete_test.api_modelo
paquete_test.api_modelo

<module 'paquete_test.api_modelo' from '/Users/heber.trujillo/projects/curso-python-cac/06 Módulos y Paquetes/paquete_test/api_modelo.py'>

## Inicializar un paquete

Si un archivo llamado `__init__.py` está dentro del directorio del paquete, éste se invoca cuando se importa el paquete o un módulo en el paquete.

Esto se puede usar para *"personalizar"* la inicialización del paquete:

Por ejemplo: 


Tenemos la siguiente estructura de módulos:

``` bash
paquete_test_2
│ 
├── __init__.py
├── api_modelo.py
├── base_datos.py
└── estimador.py
```

\__init__.py
```` python
from paquete_test_2.base_datos import Conexion, BaseDatos
from paquete_test_2.api_modelo import APIMod
from paquete_test_2.estimador import Estimador

__all__ = ["Conexion", "BaseDatos", "APIMod", "Estimador"]
````

`__all__` es una lista de `strings` que definen qué variables de un módulo / paquete se exportarán cuando se ejecute `from <module> import *`.

*base_datos.py*
```` python

class Conexion():
    def __init__(self, url: str):
            self.url = url
         
    

class BaseDatos():
    def __init__(self, conexion: Conexion):
            self.conexion = conexion

````

*api_modelo.py*
```` python

class APIMod():
    def __init__(self, url: str, port: int):
            self.url = url
            self.port = port

````


*estimador.py*
```` python
from typing import List

class Estimador():
    
    def predict(self, y: List[float])->List[float]:
        return [val*0.1 + 3 for val in y]
        
````

In [37]:
import paquete_test_2

In [38]:
paquete_test_2.estimador.Estimador()


<paquete_test_2.estimador.Estimador at 0x1143c8c10>

In [39]:
paquete_test_2.APIMod(url='127.0.0.0', port=5000)

<paquete_test_2.api_modelo.APIMod at 0x1142bbc90>

In [40]:
paquete_test_2.APIMod

paquete_test_2.api_modelo.APIMod