# Modularización

La modularización tiene como objetivo brindar una mecánica para organizar el código en múltiples archivos y permitir su importación total o parcial dónde sea requerido.


#### [Con las pilas incluidas!](https://devdocs.io/python~3.5/)
La [biblioteca estándar de Python](https://docs.python.org/3/library/index.html) es un ejemplo de una colección de paquetes y módulos:

* [`os`](https://docs.python.org/3/library/os.html) Interfase miscelanea con el sistema operativo.
* [`csv`](https://docs.python.org/3/library/csv.html) Lector de archivos separados por coma.
* [zlib](https://docs.python.org/3/library/zlib.html) [gzip](https://docs.python.org/3/library/zlib.html)
[bz2](https://docs.python.org/3/library/zlib.html) [lzma](https://docs.python.org/3/library/lzma.html) [zipfile](https://docs.python.org/3/library/zipfile.html) [tarfile](https://docs.python.org/3/library/tarfile.html) Soporte de diversos formatos de compresión.
* [string](https://docs.python.org/3/library/string.html)
[re](https://docs.python.org/3/library/re.html)
[difflib](https://docs.python.org/3/library/difflib.html)
[textwrap](https://docs.python.org/3/library/textwrap.html)
[unicodedata](https://docs.python.org/3/library/unicodedata.html)
[stringprep](https://docs.python.org/3/library/stringprep.html)
[readline](https://docs.python.org/3/library/readline.html)
[rlcompleter](https://docs.python.org/3/library/rlcompleter.html) Operaciones sobre texto.
* [struct](https://docs.python.org/3/library/struct.html)
[codecs](https://docs.python.org/3/library/codecs.html) Manejo de datos binarios
* [datetime](https://docs.python.org/3/library/datetime.html)
[calendar](https://docs.python.org/3/library/calendar.html)
[collections](https://docs.python.org/3/library/collections.html)
[collections](https://docs.python.org/3/library/collections.html)
[heapq](https://docs.python.org/3/library/heapq.html)
[bisect](https://docs.python.org/3/library/bisect.html)
[array](https://docs.python.org/3/library/array.html)
[weakref](https://docs.python.org/3/library/weakref.html)
[types](https://docs.python.org/3/library/types.html)
[copy](https://docs.python.org/3/library/copy.html)
[pprint](https://docs.python.org/3/library/pprint.html)
[reprlib](https://docs.python.org/3/library/reprlib.html)
[enum](https://docs.python.org/3/library/enum.html) Tipos de datos
* Entre muchos otros!


# ¿Cómo se crea un módulo?

En Python un módulo es cualquier archivo. El nombre del archivo es el nombre del módulo con el sufijo .py agregado. Dentro de un módulo, el nombre del mismo está disponible en el valor de la variable global \_\_name\_\_. Por ejemplo consideremos el ejemplo un archivo con el nombre `fechas.py` con el siguiente código (a partir de ahora archivo y módulo serán palabras equivalentes prefiriendo ésta última):

```python
# fechas.py
from datetime import datetime

def edad_en_dias(fecha_de_nacimiento):
    ahora = datetime.now()
    edad = ahora - fecha_de_nacimiento
    return edad.days

```
* Un **paquete** es una carpeta que al menos contiene un archivo **``__init__.py``** y puede contener otros módulos

In [38]:
import fechas

Esto no mete los nombres de las funciones definidas en fecha directamente en el espacio de nombres actual; sólo mete ahí el nombre del módulo, fechas. Usando el nombre del módulo se puede acceder a las funciones

In [39]:
from datetime import datetime
fechas.edad_en_dias(datetime(1980, 12, 8))

13070

# Más sobre los módulos

Un módulo puede contener tanto declaraciones ejecutables como definiciones de funciones. Estas declaraciones están pensadas para inicializar el módulo. Se ejecutan solamente la primera vez que el módulo se encuentra en una sentencia import.

Cada módulo tiene su propio espacio de nombres, el que es usado como espacio de nombres global por todas las funciones definidas en el módulo. Por lo tanto, el autor de un módulo puede usar variables globales en el módulo sin preocuparse acerca de conflictos con una variable global del usuario. Por otro lado, si sabés lo que estás haciendo podés tocar las variables globales de un módulo con la misma notación usada para referirte a sus funciones, nombremodulo.nombreitem.

Los módulos pueden importar otros módulos. Es costumbre pero no obligatorio el ubicar todas las declaraciones import al principio del módulo (o script, para el caso). Los nombres de los módulos importados se ubican en el espacio de nombres global del módulo que hace la importación.

Hay una variante de la declaración import que importa los nombres de un módulo directamente al espacio de nombres del módulo que hace la importación

In [11]:
from fibo import fib, fib2

Esto no introduce en el espacio de nombres local el nombre del módulo desde el cual se está importando.

Hay incluso una variante para importar todos los nombres que un módulo define

In [25]:
from fibo import *

Esta variente debe ser utilizada **con cuidado**, ya que se importa todo lo que se define y se importe en ese módulo! Para evitar esto, en el módulo se puede definir una variable de nombre ``__all__``, con una lista de los nombres de los símbolos (funciones, objetos) que se deseen exportar.
```python
# bartender.py
'''
Estos import son ficticios
'''
import vodka
import limon
import azucar
import hielo

__all__ = [
    'caipiroska',
]

def caipiroska():
    return 1 * vodka +  4 limon.gajo + 4 * azucar + hielo
```

Desde otro módulo:

```python
from bartender import *

caipiroska() 
```

## Ejecutando módulos como scripts

Cuando ejecutás un módulo de Python con

```bash
python fibo.py <argumentos>

```
...el código en el módulo será ejecutado, tal como si lo hubieses importado, pero con \_\_name\_\_ con el valor de "\_\_main\_\_". Eso significa que agregando este código al final del módulo:

```python
if __name__ == "__main__":
    import sys
    fib(int(sys.argv[1]))
```
...podés hacer que el archivo sea utilizable tanto como script, como módulo importable, porque el código que analiza la linea de órdenes sólo se ejecuta si el módulo es ejecutado como archivo principal:

```bash
$ python fibo.py 50
```

## El camino de búsqueda de los módulos

Cuando se importa un módulo llamado spam, el intérprete busca primero por un módulo con ese nombre que esté integrado en el intérprete. Si no lo encuentra, entonces busca un archivo llamado spam.py en una lista de directorios especificada por la variable sys.path. sys.path se inicializa con las siguientes ubicaciones:

* el directorio conteniendo el script (o el directorio actual cuando no se especifica un archivo).
* PYTHONPATH (una lista de nombres de directorios, con la misma sintaxis que la variable de entorno PATH.
* el directorio default de la instalación.

Luego de la inicialización, los programas Python pueden modificar sys.path. El directorio que contiene el script que se está ejecutando se ubica al principio de la búsqueda, adelante de la biblioteca estándar. Esto significa que se cargarán scripts en ese directorio en lugar de módulos de la biblioteca estándar con el mismo nombre. Esto es un error a menos que se esté reemplazando intencionalmente. Mirá la sección Módulos estándar para más información.

In [6]:
import sys
sys.path

['',
 '/home/diego/.virtualenvs/jupyter/lib/python36.zip',
 '/home/diego/.virtualenvs/jupyter/lib/python3.6',
 '/home/diego/.virtualenvs/jupyter/lib/python3.6/lib-dynload',
 '/usr/lib64/python3.6',
 '/usr/lib/python3.6',
 '/home/diego/.virtualenvs/jupyter/lib/python3.6/site-packages',
 '/home/diego/.virtualenvs/jupyter/lib/python3.6/site-packages/IPython/extensions',
 '/home/diego/.ipython']

In [7]:
import sys
sys.path.insert(1, '../codigo')

In [2]:
!python ../codigo/fibo.py 50

1 1 2 3 5 8 13 21 34 


In [4]:
!python ../codigo/edad.py 2012 7 2

1903


In [5]:
import edad

ModuleNotFoundError: No module named 'edad'

# La función dir()

La función integrada **dir()** se usa para encontrar qué nombres define un módulo. Devuelve una lista ordenada de cadenas

In [34]:
import fibo, sys
dir(fibo)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__']

Sin argumentos, dir() lista los nombres que tenés actualmente definidos

In [35]:
dir()

['In',
 'Out',
 '_',
 '_12',
 '_13',
 '_14',
 '_15',
 '_16',
 '_17',
 '_34',
 '_5',
 '_7',
 '_9',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i10',
 '_i11',
 '_i12',
 '_i13',
 '_i14',
 '_i15',
 '_i16',
 '_i17',
 '_i18',
 '_i19',
 '_i2',
 '_i20',
 '_i21',
 '_i22',
 '_i23',
 '_i24',
 '_i25',
 '_i26',
 '_i27',
 '_i28',
 '_i29',
 '_i3',
 '_i30',
 '_i31',
 '_i32',
 '_i33',
 '_i34',
 '_i35',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_i9',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 '_sh',
 'date',
 'datetime',
 'exit',
 'fechas',
 'fibo',
 'get_ipython',
 'quit',
 'sys']

dir() no lista los nombres de las funciones, tipos de datos y variables integradas. Si querés una lista de esos, están definidos en el módulo estándar builtins

In [1]:
import builtins
dir(builtins)  

['ArithmeticError',
 'AssertionError',
 'AttributeError',
 'BaseException',
 'BlockingIOError',
 'BrokenPipeError',
 'BufferError',
 'ChildProcessError',
 'ConnectionAbortedError',
 'ConnectionError',
 'ConnectionRefusedError',
 'ConnectionResetError',
 'EOFError',
 'Ellipsis',
 'EnvironmentError',
 'Exception',
 'False',
 'FileExistsError',
 'FileNotFoundError',
 'FloatingPointError',
 'GeneratorExit',
 'IOError',
 'ImportError',
 'IndentationError',
 'IndexError',
 'InterruptedError',
 'IsADirectoryError',
 'KeyError',
 'KeyboardInterrupt',
 'LookupError',
 'MemoryError',
 'ModuleNotFoundError',
 'NameError',
 'None',
 'NotADirectoryError',
 'NotImplemented',
 'NotImplementedError',
 'OSError',
 'OverflowError',
 'PermissionError',
 'ProcessLookupError',
 'RecursionError',
 'ReferenceError',
 'RuntimeError',
 'StopAsyncIteration',
 'StopIteration',
 'SyntaxError',
 'SystemError',
 'SystemExit',
 'TabError',
 'TimeoutError',
 'True',
 'TypeError',
 'UnboundLocalError',
 'UnicodeDecode

# Paquetes

Los paquetes son una manera de estructurar los espacios de nombres de Python usando "nombres de
módulos con puntos". Por ejemplo, el nombre de módulo A.B designa un submódulo llamado B en un
paquete llamado A. 

Tal como el uso de módulos evita que los autores de diferentes módulos tengan que
preocuparse de los respectivos nombres de variables globales, el uso de nombres de módulos con puntos
evita que los autores de paquetes de muchos módulos, como NumPy o la Biblioteca de Imágenes de
Python (Python Imaging Library, o PIL), tengan que preocuparse de los respectivos nombres de módulos.

Suponete que querés designar una colección de módulos (un "paquete") para el manejo uniforme de
archivos y datos de sonidos. Hay diferentes formatos de archivos de sonido (normalmente reconocidos por
su extensión, por ejemplo: `.wav`, `.aiff`, `.au`), por lo que tenés que crear y mantener una colección
siempre creciente de módulos para la conversión entre los distintos formatos de archivos. 

Hay muchas operaciones diferentes que quizás quieras ejecutar en los datos de sonido (como mezclarlos, añadir eco,
aplicar una función ecualizadora, crear un efecto estéreo artificial), por lo que ademas estarás escribiendo
una lista sin fin de módulos para realizar estas operaciones. Aquí hay una posible estructura para tu
paquete (expresados en términos de un sistema jerárquico de archivos):

```
   sound/                          Paquete superior
         __init__.py               Inicializa el paquete de sonido
         formats/                  Subpaquete para conversiones de formato
                 __init__.py
                 wavread.py
                 wavwrite.py
                 aiffread.py
                 aiffwrite.py
                 auread.py
                 auwrite.py
                 ...
         effects/                  Subpaquete para efectos de sonido
                 __init__.py
                 echo.py
                 surround.py
                 reverse.py
                 ...
         filters/                  Subpaquete para filtros
                 __init__.py
                 equalizer.py
                 vocoder.py
                 karaoke.py
                 ...
```

Al importar el paquete, Python busca a través de los directorios en
``sys.path``, buscando el subdirectorio del paquete.

Los archivos `__init__.py` se necesitan para hacer que Python trate
los directorios como que contienen paquetes; esto se hace para prevenir
directorios con un nombre común, como ``string``, de esconder sin intención
a módulos válidos que se suceden luego en el camino de búsqueda de módulos.
En el caso más simple, `__init__.py` puede ser solamente un archivo
vacío, pero también puede ejecutar código de inicialización para el paquete
o configurar la variable ``__all__``, descrita luego.

Los usuarios del paquete pueden importar módulos individuales del mismo, por
ejemplo:

```python
   import sound.effects.echo
```

Esto carga el submódulo `sound.effects.echo`.  Debe hacerse referencia al
mismo con el nombre completo. :

```python
   sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)
````

Otra alternativa para importar el submódulos es::

```python
   from sound.effects import echo
```

Esto también carga el submódulo `echo`, lo deja disponible sin su prefijo
de paquete, por lo que puede usarse así:

```python
   echo.echofilter(input, output, delay=0.7, atten=4)
```

Otra variación más es importar la función o variable deseadas directamente:

```python
   from sound.effects.echo import echofilter
```

De nuevo, esto carga el submódulo `echo`, pero deja directamente
disponible a la función `echofilter`:

```python
   echofilter(input, output, delay=0.7, atten=4)
```

Notá que al usar `from package import item` el ítem puede ser tanto un
submódulo (o subpaquete) del paquete, o algún otro nombre definido en el
paquete, como una función, clase, o variable.  La declaración `import`
primero verifica si el ítem está definido en el paquete; si no, asume que es un
módulo y trata de cargarlo.  Si no lo puede encontrar, se genera una excepción
`ImportError`.

Por otro lado, cuando se usa la sintaxis como
`import item.subitem.subsubitem`, cada ítem excepto el último debe ser un
paquete; el mismo puede ser un módulo o un paquete pero no puede ser una clase,
función o variable definida en el ítem previo

Importando \* desde un paquete
==============================

Ahora, ¿qué sucede cuando el usuario escribe
`from sound.effects import *`? Idealmente, uno esperaría que esto de
alguna manera vaya al sistema de archivos, encuentre cuales submódulos
están presentes en el paquete, y los importe a todos. Esto puede tardar
mucho y el importar sub-módulos puede tener efectos secundarios no
deseados que sólo deberían ocurrir cuando se importe explícitamente el
sub-módulo.

La única solución es que el autor del paquete provea un índice explícito
del paquete. La declaración import usa la siguiente convención: si el
código del \_\_init\_\_.py de un paquete define una lista llamada
`__all__`, se toma como la lista de los nombres de módulos que deberían
ser importados cuando se hace `from package import *`. Es tarea del
autor del paquete mantener actualizada esta lista cuando se libera una
nueva versión del paquete. Los autores de paquetes podrían decidir no
soportarlo, si no ven un uso para importar \* en sus paquetes. Por
ejemplo, el archivo sound/effects/\_\_init\_\_.py podría contener el
siguiente código:

```python
    __all__ = ["echo", "surround", "reverse"]
```

Esto significaría que `from sound.effects import *` importaría esos tres
submódulos del paquete sound.

Si no se define `__all__`, la declaración `from sound.effects import *`
*no* importa todos los submódulos del paquete sound.effects al espacio
de nombres actual; sólo se asegura que se haya importado el paquete
sound.effects (posiblemente ejecutando algún código de inicialización
que haya en \_\_init\_\_.py) y luego importa aquellos nombres que estén
definidos en el paquete. Esto incluye cualquier nombre definido (y
submódulos explícitamente cargados) por \_\_init\_\_.py. También incluye
cualquier submódulo del paquete que pudiera haber sido explícitamente
cargado por declaraciones import previas. Considerá este código:

    import sound.effects.echo
    import sound.effects.surround
    from sound.effects import *

En este ejemplo, los módulos *echo* y *surround* se importan en el
espacio de nombre actual porque están definidos en el paquete
sound.effects cuando se ejecuta la declaración `from...import`. (Esto
también funciona cuando se define `__all__`).

A pesar de que ciertos módulos están diseñados para exportar solo
nombres que siguen ciertos patrones cuando usás `import *`, también se
considera una mala práctica en código de producción.

Recordá que no está mal usar `from paquete import submodulo_especifico`!
De hecho, esta notación se recomienda a menos que el módulo que estás
importando necesite usar submódulos con el mismo nombre desde otros
paquetes.

Referencias internas en paquetes
================================

Cuando se estructuran los paquetes en subpaquetes (como en el ejemplo
sound), podés usar `import` absolutos para referirte a submódulos de
paquetes hermanos. Por ejemplo, si el módulo sound.filters.vocoder
necesita usar el módulo echo en el paquete sound.effects, puede hacer
`from sound.effects import echo`.

También podés escribir `import` relativos con la forma
`from module import name`. Estos imports usan puntos adelante para
indicar los paquetes actual o padres involucrados en el import relativo.
En el ejemplo surround, podrías hacer:

    from . import echo
    from .. import formats
    from ..filters import equalizer

Notá que los imports relativos se basan en el nombre del módulo actual.
Ya que el nombre del módulo principal es siempre `"__main__"`, los
módulos pensados para usarse como módulo principal de una aplicación
Python siempre deberían usar `import` absolutos.

Paquetes en múltiples directorios
=================================

Los paquetes soportan un atributo especial más, \_\_path\_\_. Este se
inicializa, antes de que el código en ese archivo se ejecute, a una
lista que contiene el nombre del directorio donde está el paquete. Esta
variable puede modificarse, afectando búsquedas futuras de módulos y
subpaquetes contenidos en el paquete.

Aunque esta característica no se necesita frecuentemente, puede usarse
para extender el conjunto de módulos que se encuentran en el paquete.

