# Python para el análisis de datos -  UNAV 2022-2023
---

# Instalación y productivización (I)

<img src="img/devops.png" alt="devops" width="740"/>

## Índice  <a name="indice"></a>

- [Entornos virtuales](#entornos_virtuales)
    - [¿Porque necesitamos entornos virtuales?](#porque_necesitamos_entornos_virtuales)
    - [Instalando Python](#instalando_python)
    - [Trabajando con entornos virtuales](#trabajando_entornos_virtuales)
- [De notebooks a proyectos funcionales](#notebook_proyectos_funcionales)
    - [Nuestro primer proyecto](#primer_proyecto)
    - [Proyecto con Dash](#proyecto_dash)
- [Distribuyendo nuestro codigo](#distribuyendo_codigo)
    - [Distribuyendo servicios en la nube](#distribuyendo_nube)
    - [Creando un paquete nuevo en PyPi](#paquete_nuevo_pypi)
    - [Integración Continua (CI)](#ci)


# Entornos virtuales<a name="entornos_virtuales"></a> 
[Volver al índice](#indice)

## ¿Porque necesitamos entornos virtuales?<a name="porque_necesitamos_entornos_virtuales"></a> 
[Volver al índice](#indice)

Python es un lenguaje que como todos, tiene su propio sistema para gestionar las dependencias de paquetes de terceros, lo que se conoce como paquetes. El problema reside en la forma en que estos paquetes son almancenados en la maquina en la que se instalan.

Hay que entender que Python almacena los paquetes que forman parte del core de Python en lo que se conoce como **system-packages**, pero los paquetes que instalamos nosotros se conocen como **site-packages** y se instalan en una ruta especifica. Esta ruta se puede obtener haciendo uso del modulo site. Por ejemplo:

```python
Python 3.8.1 (default, Feb 21 2021, 01:25:45) 
[GCC 9.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import site
>>> site.getsitepackages()
['/home/internetmosquito/.pyenv/versions/3.8.1/lib/python3.8/site-packages']
```

Es decir, por cada uno de los proyectos que creemos en Python, todas las dependencias que instalemos se instalaran en esa localizacion. Ahora imaginemos la siguiente situacion:

* En nuestro proyecto 1, instalamos un paquete, digamos que es pandas, la version 1.2.0
* Ahora creamos otro proyecto 2, e instalamos la misma version de pandas, la 1.2.0. De momento todo bien.
* Pasado un tiempo, proyecto 1 tiene que utilizar la version 1.3.0 de pandas, que resulta ha eliminado una funcionalidad de la version previa que el proyecto 2 necesita

La problematica esta clara, como todos los proyectos comparten la misma carpeta, si varios proyectos necesitan versiones distintas del mismo paquete, habra colisiones...¿A que proyecto debemos dar preferencia?

Es en este momento cuando los entornos virtuales cobran sentido


## ¿Que es un entorno virtual?<a name="que_es_entorno_virtual"></a> 
[Volver al índice](#indice)

Un entorno virtual no es otra cosa que un directorio con su propio lugar para instalar paquetes y una carpeta bin (o Scripts en Windows) que apunta con un enlace a la version usada en la creacion del entorno virtual. De este modo, podemos instalar de forma aislada los paquetes que queramos y en la version que queramos sin colisionar con otros proyectos.

## Instalando Python<a name="instalando_python"></a> 
[Volver al índice](#indice)

Para hacer las cosas más divertidas, es posible que a veces tengamos que usar versiones distintas de Python en función del proyecto. Esto normmalmente ocurre no porque necesitemos alguna caracteristica especial de Python (aunque puede que sea asi) sino mas bien porque alguno de los paquetes / versiones que necesitamos requiere una version distinta de Python.

Es posible incluse que os encontreís (aunque cada vez es menos frecuente) codigo legacy que usa Python 2.7. En ese caso, si queremos ejecutar el codigo para ver como funciona casi seguro que necesitaremos un Python 2.7 (que por cierto se encuentra discontinuado). 

| Comparison Parameter | Python 2 | Python 3 |
|-|-|-|
| Year of Release | Python 2 was released in the year 2000. | Python 3 was released in the year 2008. |
| “Print” Keyword | In Python 2, print is considered to be a statement and not a function. | In Python 3, print is considered to be a function and not a statement. |
| Storage of Strings | In Python 2, strings are stored as ASCII by default. | In Python 3, strings are stored as UNICODE by default. |
| Division of Integers | On the division of two integers, we get an integral value in Python 2. For instance, 7/2 yields 3 in Python 2. | On the division of two integers, we get a floating-point value in Python 3. For instance, 7/2 yields 3.5 in Python 3. |
| Exceptions | In Python 2, exceptions are enclosed in notations. | In Python 3, exceptions are enclosed in parentheses. |
| Variable leakage | The values of global variables do change in Python 2 if they are used inside a for-loop. | The value of variables never changes in Python 3. |
| Iteration | In Python 2, the xrange() function has been defined for iterations. | In Python 3, the new Range() function was introduced to perform iterations. |
| Ease of Syntax | Python 2 has more complicated syntax than Python 3. | Python 3 has an easier syntax compared to Python 2. |
| Libraries | A lot of libraries of Python 2 are not forward compatible. | A lot of libraries are created in Python 3 to be strictly used with Python 3. |
| Usage in today’s times | Python 2 is no longer in use since 2020. | Python 3 is more popular than Python 2 and is still in use in today’s times. |
| Backward compatibility | Python 2 codes can be ported to Python 3 with a lot of effort. | Python 3 is not backward compatible with Python 2. |
| Application | Python 2 was mostly used to become a DevOps Engineer. It is no longer in use after 2020. | Python 3 is used in a lot of fields like Software Engineering, Data Science, etc. |

Para solucionar esto tenemos varias alternativas:

1.- La mas compleja y laboriosa, instalar / desinstalar la unica instalación de Python que tengamos cada vez que tenemos que cambiar de proyecto. Evidentemente, esta opción es la peor.

2.- Instalar las distintas versiones que queremos desde [Python directamente](https://www.python.org/downloads/windows/) o usando un gestor de paquetes como apt o yum en Linux, la mayoria de distros en Linux permiten instalar varias versiones de Python. El problema con este enfoque es que no es sencillo indicar que Python deberia ser el que debe estar "activo". Es más, como no existe la posibilidad de diferencia entre el Python global y el que vamos a usar en cualquiera de nuestros proyectos puede ocurrir que acabamos rompiendo la instalación de Python global, lo cual puede resultar catastrofico en sistemas Linux.

3.- Utilizar alguna herramienta que permite instalar diferentes versiones de Python e indicar cuando una nueva instalación es global o local.

### Utilizando Conda para instalar nuevas versiones de Python

Una diferencia importante en como Conda trata Python es que lo trata como un paquete mas, de modo que si instalais un paquete que requiere Python, por ejemplo *numpy* o *scikit* automaticamente instalar Python, la version que requiere cualquiera de esos paquetes.

Podemos ver que versiones de Python Conda puede instalar de la siguiente manera, asumimos obviamente que Conda esta instalado y que podeís usar el comando conda (casi seguro si habeis instalado Anaconda o Anaconda Navigator)

```
conda search python
```

Para instalar una nueva version de Python, como se trata de un paquete mas, debemos crear primero un entorno virtual con Conda.

```
conda create -n mi_entorno_virtual python=3.9 numpy
```

Para ver nuestros entornos virtuales.

```
conda env list
```

Esto creare un entorno virtual con nombre mi_entorno_virtual y con Python 3.9 como la version que queremos utilizar. Ahora podemos activar el entorno.

```
conda activate mi_entorno_virtual
```

Deberiamos ver algo parecido a esto:

```
$ (mi_entorno_virtual)
```

Que nos indica que nuestro entorno esta disponible.

Ahora podemos comprobar que version de python tenemos de la forma habitual

```
$ (mi_entorno_virtual) python -version
```

Podemos actualizar a la ultima version de la rama de Python en la que estemos con el siguiente comando

```
conda update python
```

En nuestro ejemplo anterior, instalara la version mas reciente de 3.9.

Tambien podemos hacer un downgrade de la version de Python en el entorno activo de la siguiente forma aunque no es recomendable ya que puede fallar si alguno de los paquetes es incompatible con la version de Python que queremos instalar en ese entorno.




## Trabajando con entornos virtuales<a name="trabajando_entornos_virtuales"></a> 
[Volver al índice](#indice)

Ahora que ya tenemos todo listo, podemos ver como crear entornos virtuales y como utilizarlos. 

### Creando entornos virtuales

Tenemos una batería de herramientas que podemos utilizar para crear entornos virtuales. Veamos que tenemos disponible en función de nuestras necesidades y cual es la mas interesante en base a esto.

#### Utilizando el módulo venv

Desde Python 3.6, la forma recomendada de crear un entorno virtual es con el modulo venv. Anteriormente a esto, si se usaba Python 3, lo recomendable era usar el modulo [pyvenv](https://pypi.org/project/pyvenv/) (no confundir con pyenv), o utilizar alguna de las herramientas disponibles como [virtualenv](https://virtualenv.pypa.io/en/latest/) o [virtualenvwrapper](https://virtualenvwrapper.readthedocs.io/en/latest/), sobretodo para versiones previas a Python 3.

Dicho esto, veamos como podemos crear un entorno virtual (se asume que Python 3.6+ es la version por defecto del sistema):

```
$ python -m venv prueba
```

Esto crea una carpeta con el nombre 'prueba' donde hemos ejecutado el comando anterior. Veamos el contenido de esta carpeta:

```
├── scripts
│   ├── activate
│   ├── activate.csh
│   ├── activate.fish
│   ├── easy_install
│   ├── easy_install-3.5
│   ├── pip
│   ├── pip3
│   ├── pip3.5
│   ├── python -> python3.5
│   ├── python3 -> python3.5
│   └── python3.5 -> /Library/Frameworks/Python.framework/Versions/3.5/bin/python3.5
├── include
├── lib
│   └── python3.5
│       └── site-packages
└── pyvenv.cfg
```

Veamos que contiene cada carpeta:

* scripts: ficheros para interactuar con el entorno
* include: ficheros header C para compilar fuentes Python
* lib: aqui es donde se instalan las dependencias exclusivas de este entorno

Lo realmente interesante desde un punto de vista de usuario, son los scripts de activación del entorno, ya que para poder usar el entorno debemos activarlo. Para hacerlo debemos ejecutar lo siguiente:


```
source /prueba/scripts/activate
```

El resultado en la terminal de esto es el siguiente:

```
$ (prueba) 
```

Esto significa que nuestro entorno esta activo. A partir de entonces, tanto la version de Python como los paquetes que podemos usar son exclusivamente los que tengamos instalados en este entorno.


Para desactivar el entorno, simplemente podemos usar el siguiente comando

```
$ (prueba) deactivate
```

#### Utilizando pipenv o pyenv

Tenemos dos herramientas para gestionar entornos virtuales, una es pyenv, que ademas de permitir instalar versiones de Python distintas, permite tambien gestionar entornos virtuales, veamos como.

*Pyenv*

Creacion de un entorno virtual con pyenv:

```
pyenv virtualenv <version_python> <nombre_entorno>
```

El argumento <version_python> es opcional pero recomendable, tiene que ser un valor disponible en las versiones instaladas con pyenv. El argumento <nombre_entorno> es opcional tambien pero es recomendable. La salida puede ser algo asi:


```
pyenv virtualenv 3.9.0 prueba
Looking in links: /tmp/tmp4db0mre5
Requirement already satisfied: setuptools in /home/internetmosquito/.pyenv/versions/3.9.0/envs/prueba/lib/python3.9/site-packages (49.2.1)
Requirement already satisfied: pip in /home/internetmosquito/.pyenv/versions/3.9.0/envs/prueba/lib/python3.9/site-packages (20.2.3)
```

Como puede verse, pyenv instala el entorno en la ruta donde suele instalar las versiones de python, dentro de su propia carpeta *envs*

*Pipenv*

Otra opcion es usar una herramienta mucho mas completa que es [pipenv](https://pypi.org/project/pipenv/). Pipenv es una herramienta que intenta solucionar los problemas clasicos de usar pip, virtualenv o venv y la depedencia con el archiconocido "requirements.txt".

Vamos a ver como usar pipenv para crear entornos, mas adelante veremos como podemos usar pipenv tambien para gestionar las depedencias y garantizar que el entorno es reproducible por cualquier persona usando pipenv tambien.

*Instalar pipenv*

```
$ pip install pipenv
```
Una vez instalamos pipenv, nos podemos olvidar de pip ya que sirve como reemplazo. 

*Usando pipenv*

Para crear un entorno virtual con pipenv podemos usar:

```
$ pipenv --python=3.7
```

Donde --python es opcional pero tambien recomendable. Esto genera una salida parecida a esta:

```   
Creating a virtualenv for this project...
Pipfile: /home/internetmosquito/tmp/master_python_projects/Pipfile
Using /home/internetmosquito/.pyenv/versions/3.7.4/bin/python3.7m (3.7.4) to create virtualenv...
⠧ Creating virtual environment...created virtual environment CPython3.7.4.final.0-64 in 437ms
  creator CPython3Posix(dest=/home/internetmosquito/python_envs/master_python_projects-C8C_-ZXk-python, clear=False, no_vcs_ignore=False, global=False)
  seeder FromAppData(download=False, pip=bundle, setuptools=bundle, wheel=bundle, via=copy, app_data_dir=/home/internetmosquito/.local/share/virtualenv)
    added seed packages: pip==21.0.1, setuptools==52.0.0, wheel==0.36.2
  activators BashActivator,CShellActivator,FishActivator,PowerShellActivator,PythonActivator,XonshActivator

✔ Successfully created virtual environment! 
Virtualenv location: /home/internetmosquito/python_envs/master_python_projects-C8C_-ZXk-python
```

Donde instala los entornos virtuales pipenv depende de la variable de entorno WORKON_HOME. El nombre del entorno viene directamente de la carpeta donde se ejecuta el script y añade cierta aleatoriedad. Una cosa importante aqui a destacar es la aparación del fichero Pipfile. Podemos ver los contenidos del mismo:

```
[[source]]
url = "https://pypi.org/simple"
verify_ssl = true
name = "pypi"

[packages]

[dev-packages]

[requires]
python_version = "3.7"
```

Como puede verse no hemos instalado ningun paquete todavia, pero este fichero es importante porque es lo que usa pipenv como reemplazo del famoso requirements.txt, para garantizar creaciones de entornos deterministas. 

Una vez hemos instalado todo lo que queremos, podemos usar el comando:


```
$ pipenv lock
```

Que genera el fichero Pipfile.lock que entonces se puede usar para crear de forma determinista otro entorno.

Para activar el entorno, eso si, deberemos usar el siguiente comando en pipenv.

```
$ pipenv shell
```

Y ya podemos ver que el entorno esta activo. Un ejemplo de esa salida.

```
(master_python_projects) python -V
Python 3.7.4
```

#### Poetry

Una opcion alternative a pipenv es Poetry. En principio resuelve los mismos problemas y funciona muy bien con pyenv, pero además hace mas faicl la paquetizacion ya que usa el nuevo estandar de Python para esto. Poetry cuenta con mas funciones que pipenv, y esta pensando para ayudar al desarrollo desde el momento mismo en que empezamos el proyecto.

*Instalacion*

Aunque esta disponible en pip y pipx, es mas facil utilizando el script hecho a proposito para esto

```
curl -sSL https://raw.githubusercontent.com/python-poetry/poetry/master/get-poetry.py | python -
```

Una vez instalado, podemos empezar a usar Poetry

*Usando Poetry*

Si vamos a crear un proyecto nuevo desde cero, lo mejor es usar el siguiente comando

```
$ poetry new prueba
Created package prueba in prueba
```
Esto crea una estructura tal que asi

```
├── prueba
├── pyproject.toml
├── README.rst
└── tests

```

Aqui lo mas importante es el fichero pyproject.toml, que contiene información necesaria para la correcta paquetización y funcionamiento de Poetry. Veamos el contenido:

```
[tool.poetry]
name = "prueba"
version = "0.1.0"
description = ""
authors = ["internetmosquito <alejandrovillamarin@gmail.com>"]

[tool.poetry.dependencies]
python = "^3.8"

[tool.poetry.dev-dependencies]
pytest = "^5.2"

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"

```

Volveremos a este fichero mas adelante, solo quedaros con la version de Python usada. Poetry usa la version activa en ese momento. Pero podemos crear un entorno virtual con la version que queramos si esta no nos satisface. Veamos ahora como crear un entorno, Poetry no tiene un comando especifico como pipenv para esto, pero lo crea al usar el siguiente donde creaste el proyecto antes:

```
$ poetry shell
Creating virtualenv prueba-6-UAYOmD-py3.8 in /home/internetmosquito/python_envs
Spawning shell within /home/internetmosquito/python_envs/prueba-6-UAYOmD-py3.8
```

El lugar donde Poetry guarda los entornos virtuales puede configurarse con la opcion de configuracion virtualenvs.path. El comando anterior crea y activa automaticamente el nuevo entorno. Podemos obtener información sobre los entornos para este proyecto (podemos tener mas de uno si queremos) con el siguiente comando.

```
(prueba-6-UAYOmD-py3.8)  $ poetry env info       

Virtualenv
Python:         3.8.1
Implementation: CPython
Path:           /home/internetmosquito/python_envs/prueba-6-UAYOmD-py3.8
Valid:          True

System
Platform: linux
OS:       posix
Python:   /home/internetmosquito/.pyenv/versions/3.8.1
(prueba-6-UAYOmD-py3.8)  internetmosquito@internetmosqui
```


¿Cual de estas herramientas usar? Depende, si no queremos complicarnos mucho, usar el metodo estandar con el modulo venv deberia ser suficiente. Si queremos algo que nos ayude con nuestras dependencias y nos permita compartirlas de forma estable lo mejor seria pipenv. Si ademas queremos un control total sobre nuestro proyecto, lo mejor es usar Poetry.


### Gestionando dependencias<a name="gestionando_dependencias"></a> 
[Volver al índice](#indice)

#### Utilizando el módulo venv

Si hemos creado este metodo para crear el entorno virtual, nos vemos obligados a usar pip para instalar paquetes. 

**Listar paquetes**

`$ pip list -v`

```
Package         Version Location                                              Installer
--------------- ------- ----------------------------------------------------- ---------
alfred          0.0.29  c:\users\e019656\conra\git\qggwn_pylls_lib_alfred
pip             22.2.2  c:\users\e019656\test_python\prueba\lib\site-packages pip
rubik           2.0.6   c:\users\e019656\conra\git\qggwn_pylls_lib_rubik
setuptools      47.1.0  c:\users\e019656\test_python\prueba\lib\site-packages pip
```

*Nota: Usará las fuentes incluidas en la variable de entorno `PYTHONPATH`

**Listar versiones de un paquete**

`$ pip index versions pandas`

```
pandas (1.3.5)
Available versions: 1.3.5, 1.3.4, 1.3.3, 1.3.2, 1.3.1, 1.3.0, 1.2.5, 1.2.4, 1.2.3, 1.2.2, 1.2.1, 1.2.0, 1.1.5, 1.1.4, 1.1.3, 1.1.2, 1.1.1, 1.1.0, 1.0.5, 1.0.4, 1.0.3, 1.0.2, 1.0.1, 1.0.0, 0.25.3, 0.25.2, 0.25.1, 0.25.0, 0.24.2, 0.24.1, 0.24.0, 0.23.4, 0.23.3, 0.23.2, 0.23.1, 0.23.0, 0.22.0, 0.21.1, 0.21.0, 0.20.3, 0.20.2, 0.20.1, 0.20.0, 0.19.2, 0.19.1, 0.19.0, 0.18.1, 0.18.0, 0.17.1, 0.17.0, 0.16.2, 0.16.1, 0.16.0, 0.15.2, 0.15.1, 0.15.0, 0.14.1, 0.14.0, 0.13.1, 0.13.0, 0.12.0, 0.11.0, 0.10.1, 0.10.0, 0.9.1, 0.9.0, 0.8.1, 0.8.0, 0.7.3, 0.7.2, 0.7.1, 0.7.0, 0.6.1, 0.6.0, 0.5.0, 0.4.3, 0.4.2, 0.4.1, 0.4.0, 0.3.0, 0.2, 0.1
```

**Instalar un paquete**

`$ pip install pandas`

```
Collecting pandas
  Using cached pandas-1.3.5-cp37-cp37m-win_amd64.whl (10.0 MB)
Collecting pytz>=2017.3
  Downloading pytz-2022.4-py2.py3-none-any.whl (500 kB)
     ---------------------------------------- 500.8/500.8 kB 15.8 MB/s eta 0:00:00
Collecting numpy>=1.17.3
  Downloading numpy-1.21.6-cp37-cp37m-win_amd64.whl (14.0 MB)
     ---------------------------------------- 14.0/14.0 MB 72.5 MB/s eta 0:00:00
Collecting python-dateutil>=2.7.3
  Using cached python_dateutil-2.8.2-py2.py3-none-any.whl (247 kB)
Collecting six>=1.5
  Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)
Installing collected packages: pytz, six, numpy, python-dateutil, pandas
Successfully installed numpy-1.21.6 pandas-1.3.5 python-dateutil-2.8.2 pytz-2022.4 six-1.16.0
```

***

Ahora podemos ver que el nuevo paquete junto con sus dependencias transitivas estan dentro del directorio del entorno.

```
~/tmp/master_python_projects/prueba/lib/python3.8/site-packages$ tree -L 1
.
├── bcrypt
├── bcrypt-3.2.0.dist-info
├── cffi
├── cffi-1.15.0.dist-info
├── _cffi_backend.cpython-38-x86_64-linux-gnu.so
├── cffi.libs
├── easy_install.py
├── pip
├── pip-19.2.3.dist-info
├── pkg_resources
├── __pycache__
├── pycparser
├── pycparser-2.20.dist-info
├── setuptools
├── setuptools-41.2.0.dist-info
├── six-1.16.0.dist-info
└── six.py
```

***

¿Cómo comprobamos las versiones de las dependencias?

* Parseando: site-packages\<package>.dist-info\METADATA
* `$ pip check`
* `$ pip show pandas`
* `$ pipdeptree -p pandas`

Podemos especificar versiones especificas de los paquetes que queramos instalar de la siguiente manera, sino pip instenta instalar siempre la ultima:

`$ pip install numpy==1.17.3`

Con el paso del tiempo, segun vayamos añadiendo dependencias y queramos compartir nuestro proyecto con alguien, tenemos que especificar que depedencias son necesarias para nuestro proyecto. Es cuando la generación del proyecto requirements.txt tiene sentido. Veamos como hacerlo.

`$ pip freeze > requirements.txt`

`$ pip install -r requirements.txt`

El comando anterior crea el fichero con todas las depdencias que encuentra el entorno virtual activo. Ahora podemos compartir este fichero y cualquiera sabe cuales son las dependencias necesarias y puede intentar reproducir el entorno.

Para desisntalar un paquete es tan sencillo como:

`$ pip uninstall pandas`

Esto elimina exclusivamente el paquete bcrypt del entorno, lo cual es un problema a veces, ya que deja dependencias transitivas que pueden ocasionar problemas cuando instalar paquetes que tengan necesidad de paquetes distintos.

#### pipenv

Pipenv intenta reemplazar pip, con lo que no necesitamos este para poder instalar dependencias. Para instalar debemos usar

```
$ pipenv install bcrypt
Installing bcrypt...
Adding bcrypt to Pipfile's [packages]...
✔ Installation Succeeded 
Pipfile.lock not found, creating...
Locking [dev-packages] dependencies...
Locking [packages] dependencies...
Building requirements...
Resolving dependencies...
✔ Success! 
Updated Pipfile.lock (080332)!
Installing dependencies from Pipfile.lock (080332)...
  🐍   ▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉▉ 0/0 — 00:00:00

```

Esto actualiza el fichero Pipfile y sino existe, crea la primera version del fichero Pipfile.lock.


```
[[source]]
url = "https://pypi.org/simple"
verify_ssl = true
name = "pypi"

[packages]
bcrypt = "*"

[dev-packages]

[requires]
python_version = "3.7"

```

Veamos que ocurre si desisntalamos


```
$ pipenv uninstall bcrypt
```
Si vemos los contenidos del fichero Pipfile vemos que han cambiado

```   
[[source]]
url = "https://pypi.org/simple"
verify_ssl = true
name = "pypi"

[packages]

[dev-packages]

[requires]
python_version = "3.7"
```

#### Poetry

Poetry permite gestionar los paquetes de la siguiente manera:

```
$ poetry add bcrypt
Using version ^3.2.0 for bcrypt

Updating dependencies
Resolving dependencies... (2.4s)

Writing lock file

Package operations: 12 installs, 0 updates, 0 removals

  • Installing pycparser (2.20)
  • Installing pyparsing (2.4.7)
  • Installing attrs (21.2.0)
  • Installing cffi (1.15.0)

```

Esto como veremos actualiza el fichero pyproject.toml y crea o actualiza el fichero poetry.lock

```
[tool.poetry]
name = "prueba"
version = "0.1.0"
description = ""
authors = ["internetmosquito <alejandrovillamarin@gmail.com>"]

[tool.poetry.dependencies]
python = "^3.8"
bcrypt = "^3.2.0"

[tool.poetry.dev-dependencies]
pytest = "^5.2"

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"

```

#### Conda

Suponiendo que tenemos un entorno activo creado previamente con conda, veamos como podemos instalar una dependencia.

```
conda install scipy
```

Para desinstalar, es tan sencillo como

```
conda remove scipy
```

Tambien podemos actualizar un paquete de la siguiente manera

```
conda update scipy
```

Conda genera un fichero denominado environment.yml que se suele usar para reconstruir el entorno virtual. Cuando añadimos dependencias debemos usar el siguiente comando:

```
conda env update --prefix ./env --file environment.yml  --prune
```

El comando anterior asume que hay un entorno dentro de la carpeta env en el directorio actual. 

# De notebooks a proyectos funcionales<a name="notebook_proyectos_funcionales"></a> 
[Volver al índice](#indice)

En esta seccion vamos a ver como podemos movernos de la utilización de notebooks a proyectos Python completamente funcionales, listos para compartir o desplegar si fuera necesario.

## Utilizando un IDE

Aunque no es obligatorio, se recomienda la utilización de un IDE (Integrated Development Environment) para la realización de los siguientes proyectos.

Al fin y al cabo, un IDE esta pensando para facilitarnos la tarea, el objetivo es aumentar la productividad, intentando automatizar o simplificar las tareas mundanas y repetitivas, dejando que nos podamos concentrar en lo realmente importante, nuestro codigo.

Veamos que opciones tenemos para esto, se puede usar la que uno quiera, en el tema IDEs, la variedad es muy diversa pero en lineas generales, todos cumplen en el mismo cometido de una manera u otra. Los más recomendables para Python son:

* [Pycharm](https://www.jetbrains.com/pycharm/download/) - Posiblemente en las completo, tiene una versión community gratuita. Disponible en todas las plataformas.
* [Visual Studio Code](https://code.visualstudio.com/) - La alternativa Microsoft, un estupendo IDE, gratuito y disponible en todas las plataformas.
* [Atom](https://atom.io/) - Una alternativa lightweight de Github, interesante y gratuita. Disponible en todas las plataformas.
* [Sublime Text](https://www.sublimetext.com/) - Un clasico, de pago, como Atom requiere de la instalación de plugins extra. Disponible en todas las plataformas.
* VIM o EMACS - Para los valientes, se puede configurar Vim y Emacs para convertirse en un autentico IDE sin necesidad de tocar el raton ni una interfaz grafica. Solo para Linux-Mac, en Windows a través de Cygwin o WSL.

## Creación de nuestro primer proyecto, de notebook a un proyecto Python<a name="primer_proyecto"></a> 
[Volver al índice](#indice)

Para este primer proyecto vamos a utilizar las siguientes herramientas:

* Python (logico)
* Pandas 
* Flask (Un framework web muy conocido en el ecosistema Python)
* Plotly (La libreria de ploteo mas conocida ahora mismo, Streamlit hace uso de ella por ejemplo)

El objetivo de este ejercicio es ver como podemos obtener un proyecto funcional sin necesidad de usar Jupyter o notebooks, de modo que luego podemos compartir este proyecto (si queremos) de diversas formas.

### Instalando los paquetes necesarios

Vamos a instalar las dependencias que necesitamos en el entorno virtual previamente creado.

`pip pandas flask plotly`

```
Installing collected packages: zipp, typing-extensions, tenacity, MarkupSafe, itsdangerous, colorama, Werkzeug, plotly, Jinja2, importlib-metadata, click, flask
Successfully installed Jinja2-3.1.2 MarkupSafe-2.1.1 Werkzeug-2.2.2 click-8.1.3 colorama-0.4.5 flask-2.2.2 importlib-metadata-5.0.0 itsdangerous-2.1.2 plotly-5.10.0 tenacity-8.1.0 typing-extensions-4.4.0 zipp-3.9.0
```

Como vemos podemos instalar varias cosas a la vez, en este caso hemos instalado la ultima version, al no especificar una en concreto.

### Abriendo el proyecto en el IDE

Ahora que tenemos todo listo, creamos el proyecto en el IDE y empezar a trabajar en el. Veamos como se hace esto con PyCharm.

Debemos a ir a File -> New Project...

<img src="img/ide_1.png" alt="Open project in Pycharm"/>

Comprobamos las dependecias de nuestro interprete.

<img src="img/ide_2.png" alt="search for configure interpreters"/>

Ya estamos listos para empezar a escribir nuestra aplicacion.

### Creando nuestra aplicacion

Vamos a empezar a crear nuestra aplicación, escribe o pega el siguiente codigo en el fichero "main.py".

```
from flask import Flask, render_template
import pandas as pd
import json
import plotly
import plotly.express as px

app = Flask(__name__)


@app.route('/')
def main():
    df = pd.DataFrame({
        'Fruit': ['Apples', 'Oranges', 'Bananas', 'Apples', 'Oranges', 'Bananas'],
        'Amount': [4, 1, 2, 2, 4, 5],
        'City': ['SF', 'SF', 'SF', 'Montreal', 'Montreal', 'Montreal']
    })
    fig = px.bar(df, x='Fruit', y='Amount', color='City',    barmode='group')
    graph_json = json.dumps(fig, cls=plotly.utils.PlotlyJSONEncoder)
    return render_template('basico.html', graph_json=graph_json)


if __name__ == "__main__":
    app.run(debug=True)

```

Veamos que esta pasando aqui.

Las primeras sentencias simplemente estamos importando los que nos hace falta.

La siguiente linea es la obtencion de la instancia del objecto Flask que ncesitaremos para ejecutar la aplicacion. 

Despues podemos ver un metodo llamado main con un decorador que lo que indica es que Flask mapeara cualquier peticion al raiz "/" de nuestra aplicación a este metodo. Como nuestra aplicación solo tiene una ruta de momento, que es la raiz, esto funciona perfectamente. 

Dentro de la funcion, creamos un dataframe y creamos un plot pasandole el dataframe. A continuacion convertimos el plot a JSON con el metodo dumps del paquete json. El motivo de hacer esto es porque el codigo HTML de nuestra aplicacion usa la libreria Javascript de Plotly y esta necesita que el plot venga en formato JSON.

La ultima linea de nuestra funcion se encarga de renderizar y mandar el codigo HTML de nuestra pagina web como respuesta a la peticion en la unica ruta de nuesta app.

Las ultimas lineas de nuestra fichero app.py se encargan de ejecutar la aplicación Flask de modo que esta se ponga en modo de escucha para servir peticiones. El codigo este:

```
if __name__ == "__main__": 
```

Es algo muy tipico en Python, cuando Python ejecuta nuestro script asigna el valor __main__ al atributo __name__. Solo queremos que se ejecute la aplicación de Flask si nuestro script es ejecutado por Python, ya que si es importando por otro script, no queremos ejecutar la aplicación. 

Por ultimo el parametro debug, cuando esta a True, nos permite hacer cambios en el codigo sin tener que reiniciar la aplicacion cada vez.

Vamos a crear nuestro primer template. Crea una carpeta templates en la carpeta que tiene este mismo script. Luego hacemos clic derecho encima y New -> HTML y como nombre 'basico'.

<img src="img/ide_3.png" alt="Create HTML"/>

Borramos el contenido que nos ha generado PyCharm y ponemos el siguiente.

```
<!doctype html>
<html>
  <body>
    <h1>Primer proyecto con Pandas y Plotly</h1>
    <div id='chart' class='chart'></div>
  </body>
  <script src='https://cdn.plot.ly/plotly-latest.min.js'></script>
  <script type='text/javascript'>
    var graphs = {{ graph_json | safe}};
    Plotly.plot('chart',graphs,{});
  </script>
</html>
```

Esta template es muy sencilla, basicamente tenemos un contenedor <div> con id chart que es donde mostraremos nuestro plot, y a continuación el codigo Javascript que necesitamos para poder plotear con la libreria de Plotly. La parte importante de este codigo es la obtención de los datos a través de la notación {{}}. Esto hace que nuestra aplicación Flask injecte el codigo JSON del plot en la variable JS graphs. A continuación dibujamos el plot a través de Plotly.

### Ejecutando nuestro proyecto

Ahora que tenemos ya todo el codigo listo, vamos a ver como podemos ejecutar nuestro codigo.

Tenemos varias opciones para esto, podemos hacerlo directamente desde la terminal o bien usando las herramientas de PyCharm. Veamos cada caso.

*Usando el terminal*

Tanto si accedemos al terminal directamente o desde Pycharm haciendo clic en View-> Tool windows -> Terminal tendremos algo asi:

<img src="img/ide_4.png" alt="Run in terminal"/>

En este caso podemos ejecutar nuestra aplicacion colocandonos donde nuestro script este y ejecutando:

`python main.py`

El output es el siguiente:

```
 * Serving Flask app 'app' (lazy loading)
 * Environment: production
   WARNING: This is a development server. Do not use it in a production deployment.
   Use a production WSGI server instead.
 * Debug mode: on
 * Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)
 * Restarting with stat
 * Debugger is active!
 * Debugger PIN: 901-883-074

```

Basicamente esto significa que Flask ha iniciado nuestra aplicación con el servidor web de desarrollo y esta escuchando peticiones en http://127.0.0.1:5000/. Si usamos esa URL en el navegador, veremos nuestra aplicacion!

<img src="img/flask_1.png"/>

Otra forma de conseguir lo mismo, es crear una configuración en Pycharm. Veamos como, porque es mas sencillo a la larga hacerlo asi y nos permite depurar directamente desde Pycharm.

Hacemos clic en Run -> Edit configurations

Ahora ya podemos ejecutar nuestra aplicación dando al icono de play en verde. Cuando hacemos clic en este icono, se muestra la ventana Run que nos muestra el output de nuestra aplicacion.

Listo! Ya tenemos nuestra primera aplicación funcional y demostrable sin tener que recurrir a un notebook.

## Creando un proyecto con Dash<a name="proyecto_dash"></a> 
[Volver al índice](#indice)

Vamos a ver como crear un proyecto un poco mas complejo haciendo uso de [Dash](https://dash.plotly.com/introduction), una libreria que intenta facilitar un poco la labor de creacion de dashboards, aunque no llega al nivel de Streamlit.

Lo bueno de Dash es que nos permite crear aplicaciones Web interactivas para mostrar nuestro analsis de datos sin tener que tener tantos conocimientos de desarrollo Web como con el ejemplo anterior con Flask y Plotly. 

En esta aplicación que vamos a hacer haremos lo siguiente:

* Crear una aplicacion Dash
* Usar los componentes core de Dash y componentes HTML
* Customizar el estilo
* Usar callbacks para hacer la aplicación interactiva

Las dependencias que vamos a tener en este proyecto son:

* Python
* Pandas
* Dash

Veamos como hacer todo esto. El dataset que vamos a utilizar es un dataset que [muestra el precio de los aguacates en 2015 a 2018](https://www.kaggle.com/neuromusic/avocado-prices), lo hemos obtenido a traves de Kaggle.

### Creacion de carpeta de proyecto y entorno virtual

Como hicimos en el ejemplo anterior, debemos crear un directorio (o usar poetry), crear un entorno virtual e instalar las depedencias.

```
$ poetry new aguacates_dash
Created package aguacates_dash in aguacates_dash
$ cd aguacates_dash
/aguacates_dash $ poetry shell
Creating virtualenv aguacates-dash-7y_mW3xx-py3.9 in /home/internetmosquito/python_envs
Spawning shell within /home/internetmosquito/python_envs/aguacates-dash-7y_mW3xx-py3.9
/aguacates_dash $ poetry add pandas dash
Using version ^1.3.4 for pandas
Using version ^2.0.0 for dash

Updating dependencies
Resolving dependencies... (42.2s)

Writing lock file

Package operations: 27 installs, 0 updates, 0 removals

  • Installing markupsafe (2.0.1)
  • Installing click (8.0.3)
  • Installing itsdangerous (2.0.1)
  • Installing jinja2 (3.0.2)
  • Installing werkzeug (2.0.2)
  • Installing brotli (1.0.9)
  • Installing flask (2.0.2)
  • Installing pyparsing (2.4.7)
  • Installing six (1.16.0)
  • Installing tenacity (8.0.1)
  • Installing attrs (21.2.0)
  • Installing dash-core-components (2.0.0)
  • Installing dash-html-components (2.0.0)
  • Installing dash-table (5.0.0)
  • Installing flask-compress (1.10.1)
  • Installing more-itertools (8.10.0)
  • Installing numpy (1.21.3)
  • Installing packaging (21.0)
  • Installing plotly (5.3.1)
  • Installing pluggy (0.13.1)
  • Installing py (1.10.0)
  • Installing python-dateutil (2.8.2)
  • Installing pytz (2021.3)
  • Installing wcwidth (0.2.5)
  • Installing dash (2.0.0)
  • Installing pandas (1.3.4)
  • Installing pytest (5.4.3)

```

Ya podemos importar nuestro proyecto en nuestro IDE.

Asi que importamos el proyecto en PyCharm y especificamos el interprete Python a utilizar.

### Creando nuestra aplicación Dash

Vamos a añadir el fichero csv dentro del directorio aguacates_dash/aguacates_dash y creamos un script Python con nombre app (como hicimos con la aplicación Flask anterior).

Crear el fichero main.py y copia el siguiente codigo, veremos con detalle que es cada cosa.

```
import dash
from dash import dcc
from dash import html
import pandas as pd

data = pd.read_csv("avocado.csv")
data = data.query("type == 'conventional' and region == 'Albany'")
data["Date"] = pd.to_datetime(data["Date"], format="%Y-%m-%d")
data.sort_values("Date", inplace=True)

app = dash.Dash(__name__)

app.layout = html.Div(
    children=[
        html.H1(children="Analisis del precio del aguacate",),
        html.P(
            children="Analizar el comportamiento del precio del aguacate"
            " y el numero de aguacates vendidos en US"
            " entre 2015 y 2018",
        ),
        dcc.Graph(
            figure={
                "data": [
                    {
                        "x": data["Date"],
                        "y": data["AveragePrice"],
                        "type": "lines",
                    },
                ],
                "layout": {"title": "Precio medio aguacate"},
            },
        ),
        dcc.Graph(
            figure={
                "data": [
                    {
                        "x": data["Date"],
                        "y": data["Total Volume"],
                        "type": "lines",
                    },
                ],
                "layout": {"title": "Venta aguacates"},
            },
        ),
    ]
)

if __name__ == "__main__":
    app.run_server(debug=True)
```

Vamos a ir punto por punto...

```
import dash
from dash import dcc
from dash import html
import pandas as pd
```
Aqui simplemente importamos lo que nos hace falta, aqui lo imporante y nuevo es:

* dash: nos permite inicilizar la aplicacion, parecido a Flask
* dash_core_components: Nos permite crear componentes como graficas, dropdowns o selectores de fechas.
* dash_html_componentes: Nos permite acceder a tags HTML

```
data = pd.read_csv("avocado.csv")
data = data.query("type == 'conventional' and region == 'Albany'")
data["Date"] = pd.to_datetime(data["Date"], format="%Y-%m-%d")
data.sort_values("Date", inplace=True)
```

Aqui cargamos los datos y filtramos parte para no cargar todo el dataset primero. Tambien convertimos la columna Date a datetime y ordenamos los resultados en base a esa columna, por fecha.


```
app = dash.Dash(__name__)
```

Aqui inicializamos nuestra aplicación Dash, esto es muy parecido a cuando haciamos lo mismo con Flask.

```
app.layout = html.Div(
    children=[
        html.H1(children="Analisis del precio del aguacate",),
        html.P(
            children="Analizar el comportamiento del precio del aguacate"
            " y el numero de aguacates vendidos en US"
            " entre 2015 y 2018",
        ),
        dcc.Graph(
            figure={
                "data": [
                    {
                        "x": data["Date"],
                        "y": data["AveragePrice"],
                        "type": "lines",
                    },
                ],
                "layout": {"title": "Precio medio aguacate"},
            },
        ),
        dcc.Graph(
            figure={
                "data": [
                    {
                        "x": data["Date"],
                        "y": data["Total Volume"],
                        "type": "lines",
                    },
                ],
                "layout": {"title": "Venta aguacates"},
            },
        ),
    ]
)
```
Las siguientes lineas definen el layout de nuestra aplicación Dash. En este caso, estamos un contenedor (Div) que tiene una cabecera, un parrafo y dos graficos despues.

Basicamente, Dash convertira ese codigo a lo siguiente:

```
<div>
  <h1>Analisis del precio del aguacate</h1>
  <p>
    Analizar el comportamiento del precio del aguacate
    y el numero de aguacates vendidos en US entre 2015 y 2018
  </p>
  <!-- Resto -->
</div>
```

El resto es tremendamente familiar con Flask, como el hecho de como arrancar Dash...esto es asi porque Dash utliza Flask internamemente, del mismo modo que usa Plotly para generar el tema graficas y demas.

Si ejecutamos nuestro codigo, ya sea por terminal o como una configuracion de Pycharm, y accedemos en el navegador a la URL que nos indica

```
Dash is running on http://127.0.0.1:8050/

 * Serving Flask app 'app' (lazy loading)
 * Environment: production
   WARNING: This is a development server. Do not use it in a production deployment.
   Use a production WSGI server instead.
 * Debug mode: on
```

Deberiamos ver lo siguiente

<img src="img/dash_1.png"/>

Veamos como mejorar esto para que tenga mejor pinta y eventualmente, sea interactivo.

### Customizando nuestra aplicación Dash

Dash nos permite customizar en gran medida la apariencia de nuestra aplicación. Tenemos dos formas basicamente.

1.- Usando el atributo style de cada componente (lo que se traduce en in-place styling)
2.- Definiendo nuestros estilos en un fichero CSS.

Nosotros optaremos por la segunda ya que es mas facil de mantener que añadiendo estilo por cada elemento, ademas, evitamos repetir estilos para elementos similares. Dash nos permite almacenar ficheros CSS, JS, imagenes en incluso in favicon.ico en una carpeta llamanda **assets**. Asi que vamos a crearnosla.

Una vez creada, lo primero que podemos hacer es cambiar el icono para nuestra app, descargad el que [hemos elegido nosotros](https://raw.githubusercontent.com/dylanjcastillo/materials/python-dash/python-dash/additional_files/favicon.ico) o user el que queraís y guardadlo como favicon.ico en la carpeta assets.

A continuación vamos a crear el fichero CSS que nos permitira añadir estilos a cada uno de los componentes que vamos a utilizar. Crea un fichero de nombre *style.css* en esa carpeta, con el siguiente contenido:

```
body {
    font-family: "Lato", sans-serif;
    margin: 0;
    background-color: #F7F7F7;
}

.header {
    background-color: #222222;
    height: 200px;
    display: flex;
    flex-direction: column;
    justify-content: center;
}

.header-emoji {
    font-size: 48px;
    margin: 0 auto;
    text-align: center;
}

.header-title {
    color: #FFFFFF;
    font-size: 48px;
    font-weight: bold;
    text-align: center;
    margin: 0 auto;
}

.header-description {
    color: #CFCFCF;
    margin: 4px auto;
    text-align: center;
    max-width: 384px;
}

.wrapper {
    margin-right: auto;
    margin-left: auto;
    max-width: 1024px;
    padding-right: 10px;
    padding-left: 10px;
    margin-top: 32px;
}

.card {
    margin-bottom: 24px;
    box-shadow: 0 4px 6px 0 rgba(0, 0, 0, 0.18);
}
```

Veremos mas adelante como usar esto. Ahora tenemos que cambiar parte del código de nuestra app para poder usar hojas de estilo. Hay que cambiar esto:

```
app = dash.Dash(__name__)
```

Por esto:

```
external_stylesheets = [
    {
        "href": "https://fonts.googleapis.com/css2?"
                "family=Lato:wght@400;700&display=swap",
        "rel": "stylesheet",
    },
]
app = dash.Dash(__name__, external_stylesheets=external_stylesheets)
app.title = "Analisis del aguacate"
```

Aqui estamos obteniendo una hoja de estilo de Google para obtener la fuente Lato. Despues se lo pasamos a nuestra app Dash y ademas ponemos un titulo a nuestra aplicación. Cuando usamos external_stylesheets o external_javascripts Dash los añade en el <head> del codigo HTML resultante.
    
Para poder usar los estilos que vamos a definir en *style.css* debemos indicar que queremos usarlo en nuestros componentes HTML, principalmente a traves del campo className, asi que vamos a cambiar la cabecera y el parrafo que creamos antes, añadiendo un contenedor div extra.
    
    
```
html.Div(
            children=[
                html.P(children="🥑", className="header-emoji"),
                html.H1(
                    children="Analisis del Aguacate", className="header-title"
                ),
                html.P(
                    children="Analizar el comportamiento del precio del aguacate"
                             " y el numero de aguacates vendidos en US"
                             " entre 2015 y 2018",
                    className="header-description",
                ),
            ],
            className="header",
        ),
```

Aqui podemos ver que usamos varios estilos basados en el nombre de la clase: header-emoji, header-title, header-description y header. Los valores y propiedades de los mismos son irrelevantes, podeis experimentar con ellos, pero requiren conocimiento de como funciona CSS, pero se aprende mucho con prueba & error y observando el DOM en el navegador.
    
Lo ultimo que vamos a modificar son las gracias que creamos antes, para que tengan mejor pinta. Veamos el nuevo codigo para estas:
    
```
html.Div(
        children=[
            html.Div(
                children=dcc.Graph(
                    id="grafica-precio",
                    config={"displayModeBar": False},
                    figure={
                        "data": [
                            {
                                "x": data["Date"],
                                "y": data["AveragePrice"],
                                "type": "lines",
                                "hovertemplate": "$%{y:.2f}"
                                                 "<extra></extra>",
                            },
                        ],
                        "layout": {
                            "title": {
                                "text": "Precio medio aguacates",
                                "x": 0.05,
                                "xanchor": "left",
                            },
                            "xaxis": {"fixedrange": True},
                            "yaxis": {
                                "tickprefix": "$",
                                "fixedrange": True,
                            },
                            "colorway": ["#17B897"],
                        },
                    },
                ),
                className="card",
            ),
            html.Div(
                children=dcc.Graph(
                    id="grafica-volumen",
                    config={"displayModeBar": False},
                    figure={
                        "data": [
                            {
                                "x": data["Date"],
                                "y": data["Total Volume"],
                                "type": "lines",
                            },
                        ],
                        "layout": {
                            "title": {
                                "text": "Aguacates vendidos",
                                "x": 0.05,
                                "xanchor": "left",
                            },
                            "xaxis": {"fixedrange": True},
                            "yaxis": {"fixedrange": True},
                            "colorway": ["#E12D39"],
                        },
                    },
                ),
                className="card",
            ),
        ],
        className="wrapper",
    ),
```
    
Veamos que hemos cambiado aqui:
    
* Hemos metido todo dentro de su propio contenedor div, y este le aplicamos el estilo de la clase wrapper
* Cada grafica esta dentro de su propio contenedor div tambien, y tiene la clase card que le da fondo blanco y una pequeña sombra
* Desactivamos el modeBar para ambas con config={"displayModeBar": False}
* Hacemos que muestre el simbolo $ cuando nos movemos por la grafica
* En ambas establecemos el titulo y el color de la figura

Veamos como luce esto ahora

<img src="img/dash_2.png"/>


Esto tiene mejor pinta! Veamos a continucacion como conseguir interactuar con nuestras aplicación Dash.

### Interactuando con nuestra aplicacion

Vamos a añadir la capacidad de interactuar con nuestra aplicación de la siguiente manera:

* Tendremos un filtro para seleccionar la region
* Otro filtro para el tipo de aguacate
* Finalmente otro para jugar con las fechas

Vamos a añadir estos elementos a nuestro script app.py.

Primero tenemos que eliminar la query que habiamos hecho inicialmente en el dataset.

```
data = pd.read_csv("avocado.csv")
data["Date"] = pd.to_datetime(data["Date"], format="%Y-%m-%d")
data.sort_values("Date", inplace=True)
```

Despues, vamos a añadir los 3 nuevos componentes al layout, justo despues del div que tiene la cabecera y el parrafo.

```
html.Div(
    children=[
        html.Div(
            children=[
                html.Div(children="Region", className="menu-title"),
                dcc.Dropdown(
                    id="filtro-region",
                    options=[
                        {"label": region, "value": region}
                        for region in np.sort(data.region.unique())
                    ],
                    value="Albany",
                    clearable=False,
                    className="dropdown",
                ),
            ]
        ),
        html.Div(
            children=[
                html.Div(children="Type", className="menu-title"),
                dcc.Dropdown(
                    id="filtro-tipo",
                    options=[
                        {"label": avocado_type, "value": avocado_type}
                        for avocado_type in data.type.unique()
                    ],
                    value="organic",
                    clearable=False,
                    searchable=False,
                    className="dropdown",
                ),
            ],
        ),
        html.Div(
            children=[
                html.Div(
                    children="Date Range",
                    className="menu-title"
                    ),
                dcc.DatePickerRange(
                    id="rango-fecha",
                    min_date_allowed=data.Date.min().date(),
                    max_date_allowed=data.Date.max().date(),
                    start_date=data.Date.min().date(),
                    end_date=data.Date.max().date(),
                ),
            ]
        ),
    ],
    className="menu",
),
```
Veamos el primero de esos componentes, ya que los demas siguen el mismo patron, el filtro para la region, los elementos interesantes dentro del componente DropDown son:

* id: el identificador.
* options: las opciones disponibles en el selector, aqui las obtenemos del dataset, obteniendo los valores unicos y ordenandolos.
* value: el valor por defecto.
* clearable: permite dejar el campo vacio si es True.
* className: un selector de clase para aplicar estilos.

Como hemos añadido nuevos elementos y aplicamos nuevos estilos, vamos a añadir estos a nuestra hoja de estilos, añade lo siguiente:

```
.menu {
    height: 112px;
    width: 912px;
    display: flex;
    justify-content: space-evenly;
    padding-top: 24px;
    margin: 20px auto 0 auto;
    background-color: #FFFFFF;
    box-shadow: 0 4px 6px 0 rgba(0, 0, 0, 0.18);
}

.Select-control {
    width: 256px;
    height: 48px;
}

.Select--single > .Select-control .Select-value, .Select-placeholder {
    line-height: 48px;
}

.Select--multi .Select-value-label {
    line-height: 32px;
}

.menu-title {
    margin-bottom: 6px;
    font-weight: bold;
    color: #079A82;
}
```

Tenemos que modificar tambien los componentes con las graficas eliminando la figura, ya que esta se tiene que generar cada vez que haya un cambio en alguno de los componentes, a través de una función callback. Primero vamos a ver que pinta tienen nuestras graficas ahora.


```
html.Div(
    children=[
        html.Div(
            children=dcc.Graph(
                id="grafica-precio", config={"displayModeBar": False},
            ),
            className="card",
        ),
        html.Div(
            children=dcc.Graph(
                id="grafica-volumen", config={"displayModeBar": False},
            ),
            className="card",
        ),
    ],
    className="wrapper",
),
```

Como hemos comentado antes, cada vez que se interactua con alguno de los 3 elementos nuevos, Dash ejecutara una funcion de callback, que basicamente dibujara la figura de cada grafica en funcion de los valores seleccionados en los selectores. Veamos como hacer esto, tenemos que añadir el siguiente codigo a nuestro app.py.

```
@app.callback(
    [Output("grafica-precio", "figure"), Output("grafica-volumen", "figure")],
    [
        Input("filtro-region", "value"),
        Input("filtro-tipo", "value"),
        Input("rango-fecha", "start_date"),
        Input("rango-fecha", "end_date"),
    ],
)
def update_charts(region, avocado_type, start_date, end_date):
    mask = (
        (data.region == region)
        & (data.type == avocado_type)
        & (data.Date >= start_date)
        & (data.Date <= end_date)
    )
    filtered_data = data.loc[mask, :]
    price_chart_figure = {
        "data": [
            {
                "x": filtered_data["Date"],
                "y": filtered_data["AveragePrice"],
                "type": "lines",
                "hovertemplate": "$%{y:.2f}<extra></extra>",
            },
        ],
        "layout": {
            "title": {
                "text": "Average Price of Avocados",
                "x": 0.05,
                "xanchor": "left",
            },
            "xaxis": {"fixedrange": True},
            "yaxis": {"tickprefix": "$", "fixedrange": True},
            "colorway": ["#17B897"],
        },
    }

    volume_chart_figure = {
        "data": [
            {
                "x": filtered_data["Date"],
                "y": filtered_data["Total Volume"],
                "type": "lines",
            },
        ],
        "layout": {
            "title": {
                "text": "Avocados Sold",
                "x": 0.05,
                "xanchor": "left"
            },
            "xaxis": {"fixedrange": True},
            "yaxis": {"fixedrange": True},
            "colorway": ["#E12D39"],
        },
    }
    return price_chart_figure, volume_chart_figure
```

Lo importante aqui es entender que en el decorator especificamos que componentes y atributos se veran afectados por esta funcion callback, en nuestro caso logicamente son las dos graficas, y mas concretamente, el atributo figure, que es lo que queremos volver a mostrar con nuevos datos cada vez que se llama a esta funcion.

Como input en el decorador tenemos los valores de los 3 elementos que hemos definido antes. En otras palabras, cada vez que hay un cambio en el valor de uno de estos campos, esta funcion se ejecuta. El cuerpo de la funcion se divide principalmente en filtrar los datos del dataframe en base a a combinacion de los 3 elementos (de ahi la mascara) y en crear cada una de las figuras con esos datos y con los cambios de estilos que ya habiamos aplicado anteriormente.

Si todo va bien y volvemos a ejecutar, deberiamos ver algo asi


<img src="img/dash_3.png"/>

Genial! Ya tenemos nuestra segunda aplicación totalmente funcional, y ahora interactiva!

# Distribuyendo nuestro codigo<a name="distribuyendo_codigo"></a> 
[Volver al índice](#indice)

Todo esto que hemos visto hasta ahora esta genial, pero llega un momento en que queremos distribuir nuestro codigo, ya sea para mostrarselo a compañeros de trabajo, por una presentación de los resultados de un trabajo, o simplemente porque queremos que nuestro codigo este disponible.

A grosso modo, existen dos formas en que podemos distribuir nuestro codigo:

* Distribuimos nuestro codigo como un API o aplicación web, disponible en la nube
* Distribuimos una libreria con su propio API (pero no Web) y lo hacemos publico, normalmente subiendolo a PyPi

La eleccion de uno u otro depende en gran medida de la naturaleza de lo que estemos construyendo. En el caso de aplicaciones relacionadas con data science, estas suelen aplicaciones web muy dependientes de graficas y ploteo para mostrar resultados, pero nada impide crear una libreria que simplememnte devuelve datos, pero no los muestra. Como decimos, la decision es bastante personal.

Veamos a continuación como desplegar un proyecto de prueba de ambas maneras.

## Distribuyendo servicios en la nube<a name="distribuyendo_nube"></a> 
[Volver al índice](#indice)

Lo primero que debemos determinar cuando vamos a desplegar en la nube, independientemente de si se trata de un API REST, RCP, XMLRCP o gRCP o una aplicación web con un front-end, debemos escoger un proveedor donde desplegar nuestra aplicacion, y aqui es donde la cosa empieza a complicarse.

Tenemos que ver la diferencia entre PaaS, IaaS, SaaS. Pero por no complicarlo, existen gran multitud de estos:

<img src="img/proveedores_paas.jpg" alt="proveedores PaaS" width="600"/>

Por mencionar algunos solamante:

* AWS EC: El mas famoso, posiblemente de los mas flexibles. Tiene un modo gratuito (con un limite) por un año. 
* Microsoft Azure: La alternative de Microsoft, algo mas cara.
* Google Cloud Computing: La version de Google, de los mas caros.
* Linode: Un proveedor de VMs altamente customizables.
* DigitalOcean: Parecido a Linode pero van añadiendo servicios que les acercan a AWS, GPC y Azure cada vez mas. Es de los mas baratos.
* Heroku: Especialmente pensado para desarrolladores, tiene una version grauita. 

La forma en que desplegamos en cada uno de estos cambia ostensiblemente pero casi todos siguen el mismo patron.

### Desplegando nuestra primera aplicación en la nube

Debido a que tiene un modo gratuito, vamos a usar Heroku para desplegar nuestra primera aplicacion.

Vamos a utilizar la ultima aplicación que hicimos, la de los aguacates, para continuar con esto. Podemos crear un proyecto nuevo o simplememnte utilizar el existente, la opción es vuestra.

Para que esto funcione necesitamos 3 cosas:

* Tener una cuenta en [Heroku](https://signup.heroku.com/login)
* Tener instalado [el CLI de Heroku](https://devcenter.heroku.com/articles/heroku-cli)
* Instalar [Git](https://git-scm.com/downloads)

Suponiendo que teneis una cuenta en Heroku, veamos como instalar el CLI.

```
$ sudo snap install --classic heroku
[sudo] password for internetmosquito: 
heroku v7.59.0 from Heroku✓ installed
```

Podemos comprobar si esta operativo

```
$ heroku version 
 ›   Warning: heroku update available from 7.59.0 to 7.59.1.
heroku/7.59.0 linux-x64 node-v12.21.0

```

Para instalar git, el proceso es muy sencillo tambien

```
$ sudo snap install git
```

Bien, de vuelta en nuestro proyecto de aguacates, tenemos que añadir lo siguiente en app.py, justo despues de instanciar la applicacion.

```
app = dash.Dash(__name__, external_stylesheets=external_stylesheets)
app.title = "Analisis del aguacate"
server = app.server
```

Esto es necesario para que no utilizemos el servidor web incluido en Flask para desarrollo wezkerug, que no es el mas indicado para esto.

Lo primero que vamos a hacer es crear un fichero llamado runtime.txt en el raiz de nuestro proyecto, para indicarle a Heroku que version de Python tiene que usar

```
python-3.9.0
```

Luego tenemos que crear un fichero requirements.txt con lo que necesita Heroku para ejecutar nuestra aplicacion.

```
dash==1.13.3
pandas==1.0.5
gunicorn==20.0.4
```

Por ultimo tenemos que crear un fichero Procfile que usara gunicorn para lanzar nuestra aplicacion

```
web: gunicorn app:server
```

Ahora debemos crear un repositorio en nuestro directorio.

```
$ git init
```

Debemos añadir un fichero .gitignore para no subir cosas que no queremos, por ejemplo

```
.idea
*.pyc
.DS_Store # Only if you are using macOS

```

Ahora debemos crear nuestra aplicación en Heroku, subimos los cambios y activamos la aplicacion

```
$ heroku create 
$ git push heroku master
$ heroku ps:scale web=1
```

Si todo va bien, deberiamos tener nuestra aplicación disponible en la URL que nos indica Heroku en la seccion Settings de la aplicacion creada. Enhorabuena! Ya hemos desplegado nuestra primera aplicacion en la nube.

## Creando un paquete nuevo en PyPi<a name="paquete_nuevo_pypi"></a> 
[Volver al índice](#indice)

Vamos a ver como crear un proyecto que podamos usar a PyPi, para que luego alguien lo pueda instalar con pip, pipenv o Poetry y así poder usarlo.

El proyecto en si es una tonteria, vamos a hacer un paquete que genera frases aleatorias.

Para ello, como siempre, vamos a crearnos un proyecto nuevo (directorio), así como el entorno virtual asociado.

```
$ mkdir generador_aleatorio
$ cd generador_aleatorio
/generador_aleatorio $ poetry init
This command will guide you through creating your pyproject.toml config.

Package name [generador_aleatorio]:  
Version [0.1.0]:  
Description []:  El generador aleatorio de frases mas potente del mundo! No hay otro igual...tiembla Google!
Author [internetmosquito <alejandrovillamarin@gmail.com>, n to skip]:  
License []:  MIT
Compatible Python versions [^3.9]:  

Would you like to define your main dependencies interactively? (yes/no) [yes] no
Would you like to define your development dependencies interactively? (yes/no) [yes] no
Generated file

[tool.poetry]
name = "generador_aleatorio"
version = "0.1.0"
description = "El generador aleatorio de frases mas potente del mundo! No hay otro igual...tiembla Google!"
authors = ["internetmosquito <alejandrovillamarin@gmail.com>"]
license = "MIT"

[tool.poetry.dependencies]
python = "^3.9"

[tool.poetry.dev-dependencies]

[build-system]
requires = ["poetry-core>=1.0.0"]
build-backend = "poetry.core.masonry.api"


Do you confirm generation? (yes/no) [yes] 

```

Como podeis ver usamos Poetry, ya que este permite paquetizar de forma muy sencilla. El metodo habitual era utilizar [setuptools](https://setuptools.pypa.io/en/latest/) o otras herramientas parecidas, pero Poetry usa el fichero pyproject.toml que es el estandar desde hace poco para empaquetar, asi que vamos a usar Poetry.

En este caso usamos init en vez de new para que no nos genera el boilerplate tipico que nos genera con new. Una cosa importante es tener un nombre unico en el campo nombre de nuestro toml, asi que vamos a cambiarlo

```
name = "generador_aleatorio_231dsad127db"

```

Bien, ahora vamos a abrir el fichero en PyCharm y especificar el entorno virtual (recordad creadlo antes con poetry shell).

Una vez en PyCharm crea un paquete con el mismo nombre *generador_aleatorio* y añade el siguiente modulo frases.py

```
frases = [
    {
        "frase": "El noble, el guerrero, el aventurero viven en el mundo de los hechos.  "
        "El sacerdote, el sabio, el filósofo viven en el mundo de las verdades. ",
        "autor": "Oswald Spengler",
    },
    {
        "frase": "Ciertos libros son hechos para ser probados, otros para ser  "
        "tragados y unos pocos son hechos para ser masticados y digeridos.",
        "autor": "Francis Bacon",
    },
    {
        "frase": "La lectura de todo buen libro es como una conversación con los  "
        "hombres que lo han escrito, los más dignos de las edades pasadas; una conversación "
        "selecta, en la cual no nos descubren sino sus mejores pensamientos.",
        "autor": "Rene Descartes",
    },
]
```


Bien, ahora necesitamos una funcion que al llamarla nos devuelve una frase, crea un modulo llamado generador y añade lo siguiente:

```
import random

from generador_aleatorio.frases import frases


def obtener_frase() -> dict:
    """
    Devuelve una frase aleatoria

    Obtiene una frase aletoria de nuestro repositorio de frases celebres

    :return: la frase seleccionada
    :rtype: dict
    """

    return frases[random.randint(0, len(frases) - 1)]
```

Por ultimo, tenemos que exportar nuestra funcion en el fichero __init__.py de nuestro modulo

```
"""
Generador de frases celebres aleatorias
=======================================

Obtiene una frase celebre de forma aleatoria
"""
from .generador import obtener_frase

__all__ = ["obtener_frase"]
```

Deberiamos de añadir documentacion, testing, linting, etc, pero vamos a intentar subir a PyPi primero.

Ahora debemos crearnos una cuente en PyPi si no tenemos una ya. Debemos generar una clave API para poder subir a PyPi. Una vez tengamos una, podemos guardarla en cualquier sitio, pero hay que tener en cuenta que no se muestra mas que una vez en PyPi.

Ahora simplemente ejecutando:

```
$ poetry config pypi-token.pypi pypi-AgEIcHlwaS5vcmcCJDQ1YzEwY2NhLTVhODgtNGIxZi1iM2NlLTM2M2EwM2JkNmI5OQACJXsicGVybWlzc2lvbnMiOiAidXNlciIsICJ2ZXJzaW9uIjogMX0AAAYgeeeC5pyI16zO2de7n69RhslDWezGDTcQMCHC80JQwkU
$ poetry publish --build
Building generador_aleatorio_231dsad127db (0.1.0)
  - Building sdist
  - Built generador_aleatorio_231dsad127db-0.1.0.tar.gz
  - Building wheel
  - Built generador_aleatorio_231dsad127db-0.1.0-py3-none-any.whl

Publishing generador_aleatorio_231dsad127db (0.1.0) to PyPI
 - Uploading generador_aleatorio_231dsad127db-0.1.0-py3-none-any.whl 100%
 - Uploading generador_aleatorio_231dsad127db-0.1.0.tar.gz 100%

```

Ya tenemos nuestro proyecto subido en PyPi

## Integración Continua (CI)<a name="ci"></a>
[Volver al índice](#indice)


La integración continua es una práctica de desarrollo de software mediante la cual los desarrolladores combinan los cambios en el código en un repositorio central de forma periódica, tras lo cual se ejecutan versiones y pruebas automáticas. La integración continua se refiere en su mayoría a la fase de creación o integración del proceso de publicación de software y conlleva un componente de automatización (p. ej., CI o servicio de versiones) y un componente cultural (p. ej., aprender a integrar con frecuencia). Los objetivos clave de la integración continua consisten en encontrar y arreglar errores con mayor rapidez, mejorar la calidad del software y reducir el tiempo que se tarda en validar y publicar nuevas actualizaciones de software.

**¿Por qué es necesaria la integración continua?**

Anteriormente, era común que los desarrolladores de un equipo trabajasen aislados durante un largo periodo de tiempo y solo intentasen combinar los cambios en la versión maestra una vez que habían completado el trabajo. Como consecuencia, la combinación de los cambios en el código resultaba difícil y ardua, además de dar lugar a la acumulación de errores durante mucho tiempo que no se corregían. Estos factores hacían que resultase más difícil proporcionar las actualizaciones a los clientes con rapidez.

**¿En qué consiste la integración continua?**

Con la integración continua, los desarrolladores envían los cambios de forma periódica a un repositorio compartido con un sistema de control de versiones como Git. Antes de cada envío, los desarrolladores pueden elegir ejecutar pruebas de unidad local en el código como medida de verificación adicional antes de la integración. Un servicio de integración continua crea y ejecuta automáticamente pruebas de unidad en los nuevos cambios realizados en el código para identificar inmediatamente cualquier error.

<img src="img/continuous_integration.png" alt="Integración continua" width="1200"/>
<small><i>* Fuente: AWS</i></small>

 - Jenkins: [https://www.jenkins.io/](https://www.jenkins.io/)
 - Artifactory: [https://jfrog.com/artifactory/](https://jfrog.com/artifactory/)

### Git

Git for All Platforms: [https://git-scm.com/](https://git-scm.com/)

Git repository hosting: [https://bitbucket.org/](https://bitbucket.org/)


**Setup**

Configuring user information used across all local repositories

`git config --global user.name "[firstname lastname]"`

set a name that is identifiable for credit when review version history

`git config --global user.email "[valid-email]"`

set an email address that will be associated with each history marker

**Setup & Init**

Configuring user information, initializing and cloning repositories

`git init`

initialize an existing directory as a Git repository

`git clone [url]`

retrieve an entire repository from a hosted location via URL

**Stage & Snapshot**

Working with snapshots and the Git staging area

`git status`

show modified files in working directory, staged for your next commit

`git add [file]`

add a file as it looks now to your next commit (stage)

`git reset [file]`

unstage a file while retaining the changes in working directory

`git diff`

diff of what is changed but not staged

`git diff --staged`

diff of what is staged but not yet commited

`git commit -m "[descriptive message]"`

commit your staged content as a new commit snapshot

**Branch & Merge**

Isolating work in branches, changing context, and integrating changes

`git branch`

list your branches. a * will appear next to the currently active branch

`git branch [branch-name]`

create a new branch at the current commit

`git checkout`

switch to another branch and check it out into your working directory

`git merge [branch]`

merge the specified branch’s history into the current one

**Inspect & Compare**

Examining logs, diffs and object information

`git log`

show the commit history for the currently active branch

`git log branchB..branchA`

show the commits on branchA that are not on branchB

`git log --follow [file]`

show the commits that changed file, even across renames

`git diff branchB...branchA`

show the diff of what is in branchA that is not in branchB

`git show [SHA]`

show any object in Git in human-readable format

**Tracking path changes**

Versioning file removes and path changes

`git rm [file]`

delete the file from project and stage the removal for commit

`git mv [existing-path] [new-path]`

change an existing file path and stage the move

`git log --stat -M`

show all commit logs with indication of any paths that moved

**Ignoring patterns**

Preventing unintentional staging or commiting of files
```
logs/
*.notes
pattern*/
```

Save a file with desired paterns as .gitignore with either direct string matches or wildcard globs.

`git config --global core.excludesfile [file]`

system wide ignore patern for all local repositories

**Share & Update**

Retrieving updates from another repository and updating local repos

`git remote add [alias] [url]`

add a git URL as an alias

`git fetch [alias]`

fetch down all the branches from that Git remote

`git merge [alias]/[branch]`

merge a remote branch into your current branch to bring it up to date

`git push [alias] [branch]`

Transmit local branch commits to the remote repository branch

`git pull`

fetch and merge any commits from the tracking remote branch

**Rewrite history**

Rewriting branches, updating commits and clearing history

`git rebase [branch]`

apply any commits of current branch ahead of specified one

`git reset --hard [commit]`

clear staging area, rewrite working tree from specified commit

**Temporary commits**

Temporarily store modified, tracked files in order to change branches

`git stash`

Save modified and staged changes

`git stash list`

list stack-order of stashed file changes

`git stash pop`

write working from top of stash stack

`git stash drop`

discard the changes from top of stash stack