# Preparar nuestro entorno de trabajo

<img src="https://www.python.org/static/img/python-logo.png" alt="yogen" style="width: 200px; float: right;"/>
<br>
<br>
<br>
<a href = "http://yogen.io"><img src="http://yogen.io/assets/logo.svg" alt="yogen" style="width: 200px; float: right;"/></a>

# Objetivo

Instalar Anaconda en nuestras máquinas

Comprender qué son Anaconda, IPython, Jupyter y los notebooks.

Aprender a utilizar el notebook con efectividad.

Conocer el concepto de _Literate Programming_

# Anaconda

Anaconda es una **distribución** de Python.

Especialmente enfocada a Data science, instala por defecto muchos paquetes que nos serán muy útiles.

Tiene 3 aspectos que nos facilitan la vida:

- Distribución con ~150 paquetes ampliamente utilizados

- El gestor de paquetes `conda`

- Gestión integrada de dependencias y entornos (_environments_)

# Anaconda

Vamos a instalar Anaconda en nuestras máquinas.

Dirigíos a https://www.anaconda.com/download/ y descargad la versión apropiada para vuestro sistema operativo.

Descargad la versión de **Python 3**

[![Anaconda](figs/anaconda-screenshot.png)](https://www.anaconda.com/download/)

Mientras descarga, vamos a comentar qué es y por qué nos interesa

# Conda

`conda` es el **gestor de paquetes y entornos** de Anaconda. Es por tanto sólo un componente de la distribución.

Nos permite instalar fácilmente paquetes que tienen, por ejemplo, dependencias escritas en otros lenguajes.




### Por ejemplo, `numpy`

`numpy` es un paquete de computación numérica que usaremos mucho en el máster.

Aquí tenéis un [ejemplo](https://stackoverflow.com/questions/20567418/error-installing-numpy) de los problemas que suelen surgir al intentar instalarlo por nuestra cuenta.


## Ventajas de `conda`

Podemos utilizarlo en modo usuario.

Simplifica la gestión de dependencias externas a Python

Nos permite crear entornos de trabajo aislados para distintos proyectos

http://technicaldiscovery.blogspot.com/2013/12/why-i-promote-conda.html

## Uso de conda

En este curso, casi exclusivamente vamos a usar:


```bash
conda install package
```

Instala la version más reciente del paquete solicitado. Esto nos valdrá el 95% de las veces.

```bash
conda search package
```

Nos permite buscar un paquete. Útil si no lo encontramos por defecto.

```bash
conda env export > environment.yml
```

Exporta al archivo environment.yml la descripción del entorno actual


## Environments

Los environments nos permiten mantener aisladas las dependencias de distintos proyectos que conviven en una máquina.

Nos permiten también describir a los usuarios de nuestro proyecto qué necesitan para correr nuestro código

En este curso sólo vamos a usar un environment, `default`

# Instalar Anaconda

La descarga debería haber terminado. Ahora, seguid las instrucciones en [la página de Anaconda](https://conda.io/docs/user-guide/install/index.html) para vuestro sistema operativo: [Linux](https://docs.continuum.io/anaconda/install/linux.html), [macOS](https://docs.continuum.io/anaconda/install/mac-os) o [Windows](https://docs.continuum.io/anaconda/install/windows.html).

# Qué es una IDE?

_**I**ntegrated **D**evelopment **E**nvironment._

Una IDE normalmente cuenta con:

-   Editor de código fuente

-   Explorador de variables

-   Línea de comandos del intérprete

-   Historial de comandos

-   Explorador de ficheros

-   Depurador

-   Otras herramientas

## Spyder

Una IDE pensada especialmente para el desarrollo de Data Science.

En este curso no la vamos a utilizar, pero vosotros deberíais probarla y decidir si la preferís.

# Ipython

_Interactive_ Python

Es un _intérprete_ alternativo al estándar

Creado por Fernándo Pérez, entonces doctorando en Física

Diseñado para facilitar un estilo de exploración

# _Literate Programming_

> Literate programming is a programming paradigm introduced by Donald Knuth in which a program is given as an explanation of the program logic in a natural language, such as English, interspersed with snippets of macros and traditional source code, from which a compilable source code can be generated.

>   De https://en.wikipedia.org/wiki/Literate_programming

> Literate programming: Instead of imagining that our main task is to instruct a computer what to do, let us concentrate rather on explaining to human beings what we want a computer to do.

>   Donald Knuth (1984)

## _Literate Programming_ en Data Science

El objectivo del programador en Data Science es tanto generar modelos como generar explicaciones.

Los modelos pueden ser programas para ser ejecutados en un ordenador, pero las explicaciones tienen como público otros humanos.

Incluso en el caso de que sólo estemos generando modelos para consumo vía API, por ejemplo, tener juntos código y resultados nos permite comunicar con efectividad y precisión los detalles de nuestro análisis.

Por ello el paradigma del literate programming se adapta especialmente bien a la Data Science.

Todavía más si estamos en un entorno didáctico!

# El notebook

La herramienta que nos va a permitir desarrollar de acuerdo con este paradigma es el _notebook_

https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks

El notebook es un formato de archivo y toda una arquitectura asociada que nos permite mostrar, en un mismo documento:

- Texto formateado con [Markdown](https://en.wikipedia.org/wiki/Markdown)


- Fórmulas matemáticas formateadas con [$\LaTeX$](https://www.latex-project.org/)

- Código, originalmente sólo en Python pero actualmente en muchos lenguajes

- Los resultados de evaluar ese código

- Figuras

# El notebook

![Jupyter Architecure](figs/notebook_components.png)

In [2]:
x = 2
2 * x

4

## Cómo ejecutamos un notebook

Tecleamos en nuestra terminal (Linux o macOS) o en el Anaconda Prompt (Windows):

```bash
jupyter notebook
```

Esto lanza el servidor de notebooks. Para comunicarnos con él sólo necesitamos introducir la url que nos indica en un navegador web. 

Veremos un listado de archivos y directorios contenidos **en el directorio desde donde lanzamos el servidor**

A partir de ahí, podemos crear nuevos notebooks o abrir alguno ya existente que nos hayamos descargado

# El notebook

El notebook se ordena en celdas.

Cada celda es una unidad de ejecución independiente. Las hay de dos tipos principales: de Markdown y de código.

Lo más importante que hay que recordar es el notebook es **modal**. Tiene dos modos:

- En _Edit mode_, modificamos el contenido de las celdas: cortamos y pegamos texto o código, ejecutamos celdas...

- En _Command mode_, cambiamos el tipo de celda, cortamos y pegamos celdas, añadimos celdas...

Al usarlo es importante recordar en qué modo estamos y que en _command mode_ al pulsar la tecla `h` obtenemos una lista de atajos de teclado

In [37]:
78

78

In [43]:
x = 8

In [42]:
x

3

# El notebook

Es importante también, cuando estamos elaborando o interpretando un notebook, fijarse en el _orden de ejecución_ de las celdas. 

Aparece a la izquierda de las celdas de código como `In [n]` y `Out [n]`. Este último sólo aparecerá si la evaluación de la última celda devuelve un valor distinto de `None`.

## Markdown

Es un lenguaje de markup, como HTML

Fácil de leer para humanos en su forma cruda

## Plotear con matplotlib

El notebook nos permite incorporar fácilmente gráficos en línea, junto al código que los genera. 

Matplotlib es la librería más común de gráficos en Python, pero no es ni mucho menos la única.

## LaTeX en el notebook

$\LaTeX$ es un lenguaje de markup especialmente diseñado para el maquetado de ecuaciones matemáticas, muy usado en la academia

No lo vamos a aprender en este curso en detalle

Nos permite escribir ecuaciones como ésta:

$$\mu = \frac{\sum\limits_{i=1}^{n}{x_i}}{n}$$

## Para saber más

https://docs.continuum.io/anaconda/

https://stackoverflow.com/questions/42096280/how-is-anaconda-related-to-python

https://conda.io/docs/user-guide/tasks/manage-environments.html

http://www.literateprogramming.com/knuthweb.pdf (PDF)

https://en.wikipedia.org/wiki/Literate_programming

http://www.literateprogramming.com/

https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks

https://www.youtube.com/watch?v=g8xQRI3E8r8

https://www.nature.com/articles/d41586-018-07196-1
