# Paquetes y Ambientes:
## Como instalar paquetes y manejar ambientes de virtuales

#### Fuentes utilizadas para este tutorial: 
- ["Python Modules and Packages - An Introduction"](https://realpython.com/python-modules-packages/)
- [What Is a Python Package?](https://www.udacity.com/blog/2021/01/what-is-a-python-package.html)
- [What are Python packages?](https://www.educative.io/edpresso/what-are-python-packages)
- [Managing environments](https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html)

# A. Paquetes

# Que son los paquetes y por que quiero usarlos?

Un paquete es un **conjunto de modulos relacionados entre si**, un modulo, por otro lado, es un **conjunto de funciones** que llevan a cabo una o mas tareas similares.

Por lo tanto un paquete es un **directorio** de **modulos** de Python que contienen un archivo adicional llamado `__init__.py`. Este archivo es clave ya que distingue un directorio comun y corriente de un paquete!

![Diagrama paquete](img/paquetes.svg "Anatomia de un paquete")

Los modulos son sumamente utiles porque nos permiten utilizar herramientas comunes (o no tan comunes) sin tener que reinventar la rueda, ademas de que ayudan a **modularizar** nuestro codigo, lo que a su vez nos ayuda a mantenerlo en el futuro.

### Como podemos utilizar modulos en Python?

Esto es tremendamente sencillo, y veremos un ejemplo a continuacion:

Imaginemos que nuestro proyecto implica realizar calculos matematicos, como por ejemplo calcular el area de una circunferencia. Nosotros sabemos que hay una formula sencilla para esto: $\pi r^2$.
Podemos escribir un valor aproximado de $\pi$ nosotros mismos, o bien podemos importar el modulo `math` y usar la constante $\pi$ que esta dentro de ella!

In [3]:
import math

def area_circle(radius):
    return radius ** 2 * math.pi

print(area_circle(1))

3.141592653589793


Este es un ejemplo sencillo, por su puesto, pero no es dificil imaginar situaciones mucho mas complejas en donde esto se utiliza, es mas, es mucho mas comun utilizar paquetes y modulos de terceros que escribir todo el codigo uno mismo!

## Anatomia de un paquete

Ya vimos que un paquete es una coleccion de funciones o metodos ligados a una tematica comun que se diferencian de otros directorios con un arcihvo `__init__.py`.

Supongamos tenemos nuestro paquete llamado luan que tiene la siguiente estructura:

```
Luan
  |-__init__.py
  |-modulo1.py
  └-modulo2.py
 ```
Y cuyos contenidos son:

```python
#modulo1.py
def foo():
    print('Modulo1 foo()')

class Foo:
    pass

#modulo2.py
def bar():
    print('Modulo2 bar()')

class Bar:
    pass
```

Si nuestro paquete se encontrara dentro del `path` del sistema (ver `sys.path`), entonces podemos importar los modulos con la notacion de **punto**

```python
import <modulo>[, <modulo>]
```

Por ejemplo con nuestro paquete Luan seria lo siguiente:

```python
>>> import Luan.modulo1, Luan.modulo2
>>> Luan.modulo1.foo()
'Modulo1 foo()'
>>> Luan.modulo2.Bar()
```

Podemos usar cualquier sistema de importacion para importar nuestros modulos y paquetes. Aqui un resumen de las distintas maneras para importar:

```python
import <paquete>
from <paquete> import <modulo>
import <paquete> as nombre
from <paquete> import <modulo> as <nombre>
from <paquete> import *
```
Las diferencias aqui son que en la primera linea estamos importando un **paquete completo**, mientras que en la segunda linea estamos importando un **modulo especifico de un paquete**, o quizas incluso estamos importando un **subpaquete** dentro del paquete!
En la tercera y cuarta linea le estamos **asignando un nombre** a un paquete o un modulo o subpaquete especifico.
Finalmente la ultima linea importa todo de un paquete **sin utilizar un nombre**!

En el caso de nuestro ejemplo esto ultimo funciona asi:
```python
from Luan.modulo1 import *
from Luan.modulo2 import *
>>> foo()
'Modulo1 foo()'
>>> Bar()
```

Si bien podemos importar un paquete directamente con `import <paquete>` esto no necesariamente sera util ya que no siempre se incluiran los modulos o subpaquetes. Es recomendable importar los modulos que queramos utilizar!

## Archivo \_\_init\_\_.py

Este archivo le dice a Python que un directorio corresponde en realidad a un paquete, y por lo tanto decimos que _inicializa_ el paquete. Podemos dejar este archivo vacio y funcionara de todas maneras, pero tambien podemos colocar informacion util dentro de el.

Por ejemplo si el paquete Luan tuviera este archivo \_\_init\_\_.py:

```python
print(f'Invocando __init__.py para el paquete {__name__}')
A = ['Pauli', 'Pola', 'Raza']
```

Entonces al importar el paquete se inicializara la lista global _A_

```python
>>> import Luan
'Invocando __init__.py para el paquete Luan'
>>> Luan.A
"['Pauli', 'Pola', 'Raza']"
```

Con este archivo podemos hacer que se importan los modulos de un paquete de manera automatica!
Por ejemplo, si nuestro archivo \_\_init\_\_.py se ve de esta manera:

```python
print(f'Invocando __init__.py para el paquete {__name__}')
import Luan.modulo1, Luan.modulo2
```

Entonces al importar el paquete `Luan`, los modulos `modulo1` y `modulo2` se importan automaticamente!

Podemos ver un ejemplo del mundo real en accion. Este es el archivo \_\_init\_\_.py del paquete [astroARIADNE](https://github.com/jvines/astroARIADNE/)

```python
"""
ARIADNE is a module to easily fit SED models using nested sampling algorithms.
It allows to fit single models (Phoenix v2, BT-Settl, BT-Cond, BT-NextGen
Castelli & Kurucz 2004 and Kurucz 1993) or multiple models in a single run.
If multiple models are fit for, then ARIADNE automatically averages the
parameters posteriors as in the Bayesian Model Average framework. This
averages over the models and thus the averaged posteriors account for model
specific uncertainties.
"""
from . import utils
from .fitter import Fitter
from .star import Star
from .librarian import Librarian
from .plotter import SEDPlotter
```

Esto importa al modeulo `utils` y a las clases `Fitter`, `Star`, `Librarian`, y `SEDPlotter` de los modulos `fitter`, `star`, `librarian` y `plotter` respectivamente.

# Instalando Paquetes

Instalar paquetes es relativamente sencillo. La gran mayoria de instalaciones de Python vienen con `pip`, un gestor de paquetes. Instalar paquetes con `pip` es tan directo como escribir en la terminal: `pip install <paquete>`. Esto funcionanara siempre y cuando el paquete exista en los repositorios de PyPi, de no ser asi, `pip` se quejara que el paquete no existe!

Por ejemplo si queremos instalar el paquete `termcolor` para imprimir cosas a la terminal con <span style="color:blue">c</span><span style="color:red">o</span><span style="color:green">l</span><span style="color:mediumseagreen">o</span><span style="color:orange">r</span><span style="color:deeppink">e</span><span style="color:khaki">s</span>, escribiriamos `pip install termcolor`

Esa no es la unica manera de instalar paquetes. Si nuestra instalacion de Python vienes de `anaconda` o `mini conda`, podemos utilizar `conda` para instalar paquetes! Utilizar `anaconda` tiene mas ventajas que solo instalar paquetes, como veremos pronto ;)

## setup.py

No todos los paquetes y codigos estaran en un repositorio formal, o a veces queremos utilizar la ultima version, incluso cuando esta no sea estable. Para instalar este tipo de paquetes debemos descargar el codigo desde un servicio como GitHub y luego ejecutar el script `setup.py`. Todo paquete instalable *debe* tener este script!

Finalmente la instruccion seria: `python setup.py install`

## Anaconda

Para poder utilizar `anaconda` primero debemos [instalarlo](https://www.anaconda.com/). Una vez instalado podemos instalar paquetes utilizando el comando `conda install <paquete>` en la terminal. Por ejemplo: `conda install numpy` instalaria el paquete de computacion cientifica `numpy`. Hay una salvedad con `conda`, no todos los paquetes estan en el repositorio principal! Muchas veces podemos encontrar paquetes en repositorios alternativos de `conda`, y uno de los mas comunes es `conda-forge`. Por ejemplo, si quisieramos instalar `astroquery`, el paquete para acceder a diferentes bases de datos astronomicas a traves de Python, escribiriamos: `conda install -c conda-forge astroquery`. El flag `-c` le indica a `conda` que lo que sigue es el _canal_ o repositorio a utilizar para buscar el paquete.

Existen mas canales asi que deben estar atentos al metodo de instalacion de los paquetes que vayan a utilizar!

Con el método que seguimos recién, todos los paquetes se instalan en el ambiente *base* de Python, y en general se instalan en sus ultima version estable. Pero que pasa si queremos una version en particular de un paquete?

Digamos que queremos utilizar Parallel Tempering Markov Chain Monte Carlo (PTMCMC) a traves del paquete `emcee`. Podemos instalarlo usando `pip install emcee` y al intentar usar PTMCMC vemos que ha sido removido del paquete! Por suerte sabemos que PTMCMC esta en la verison `2.2.1` de `emcee`, podemos instalar esta version con: `pip install emcee==2.2.1`.

## Actividad Práctica

Para aprender un poco más sobre los paquetes clásicos que se utilizan en astronomía puede ir a los jupyter notebooks que se encuentran en el ítem 2 del repositorio, bajo el nombre de `Paquetes_Astronomia`

# B. Ambientes Virtuales

Como dijimos antes, los paquetes que instalamos quedan todos en el ambiente *base*, pero existe la posibilidad de tener ambientes diferentes, independientes entre si, donde los paquetes instalados en uno no aparecen en los otros. Estos se llaman _ambientes virtuales_ . (Como vimos en el video)


# Por que necesitamos ambientes virtuales?

Es comun en astronomia y otras areas que uno se encuentre trabajando en mas de un proyecto a la vez, tambien es comun que estos proyectos no estemos utilizando las mismas herramientas o paquetes!

Cuando esto ocurre, es facil empezar a enredarse con las diferentes versiones de los paquetes y modulos que estamos utilizando, y a medida que necesitamos cosas nuevas y vamos instalando, facilmente podemos llegar a un punto en donde un proyecto **deje de funcionar**!

Un ejemplo de esta ocurrencia es el mismo paquete `emcee` que mencionamos en la seccion anterior. El modulo de PTMCMC fue depreciado despues de la version `2.2.1`, asi que una aplicacion que requiera esa funcionalidad especifica solo funcionaria con dicha version, pero que pasa si queremos utilizar las ventajas de la version mas reciente para un proyecto diferente que no requiere de PTMCMC? Actualizar `emcee` haria que nuestro proyecto original no funcione! Esto se soluciona con los ambientes virtuales :)

## Como se crean ambientes virtuales?

Para esta seccion asumiremos que se esta utilizando `conda`.

### Crear un ambiente desde la terminal

Para crear un ambiente en la terminal se invoca la instruccion ~
`conda create --name <nombre>`

Por ejemplo asi podemos crear el ambiente llamado science

`conda create --name science`

Intentelo en sus terminales!

Podemos crear un ambiente que utilice una version especifica de python tambien, en caso que queramos utilizar una version mas antigua.

`conda create -n <nombre> python=3.6`

Asimismo podemos crear ambientes con paquetes especificos instalados

`conda create -n <nombre> scipy`

Tambien podemos especifiar una version especifia para un paquete:

`conda create -n <nombre> scipy=0.15.0`

Y podemos combinar todo:

`conda create -n <nombre> python=3.7 scipy=0.15.0 numpy pandas matplotlib`

Es recomendable instalar todos los paquetes necesarios al mismo tiempo, de otra manera pueden haber problemas de dependencias!

Hay mas maneras de crear ambientes, como duplicar otro, crear un ambiente desde un archivo .yml e incluso podemos volver a una version anterior de nuestro ambiente. Para ver las maneras mas avanzadas de creacion de ambientes se puede ver la [guia](https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html) de `anaconda`

## Como accedo a estos ambientes?

Una vez hemos creado un ambiente podemos activarlo utilizando `conda activate <nombre>`, asi de facil! :P

## Necesito compartir mi codigo con un colega, puedo compartirle mi ambiente?

En el caso que necesitemos colaborar con colegas y entregarles nuestro codigo, podemos generar un archivo especial con toda la informacion necesaria para recrear el ambiente.
Para esto ejecutamos el comando `conda env export > <nombre>.yml` y ya esta! ahora podemos entregarle ese archivo a nuestro colega y este podra instalarlo con `conda env create -f <nombre>.yml -n <nombre>` :D

(Ejemplo: `conda env export > test_env.yml`)