# Jupyter y IPython

En esta lección se presenta un ambiente de cómputo interactivo basado en el interprete [IPython](https://ipython.org/) y su integración con las herramientas del proyecto [Jupyter](https://jupyter.org/)

## ¿Qué es Jupyter?

Jupyter es un proyecto que incorpora

- El formato `notebook`
- Una aplicación web para visualizar y escribir `notebooks`
- Un protocolo de mensajería para comunicar el notebook con un `kernel`

El `notebook` es un formato relativamente nuevo que combina

- código 
- visualizaciones 
- ecuaciones
- texto enriquecido
- imágenes, audio, video
- interfaces de usuario (GUI)
- entre otros

esto lo hace ideal para 

- realizar exploración y análisis de datos
- comunicar y compartir resultados
- crear "[narrativas científicas](https://github.com/mcburton/computational-narratives-with-jupyter)" interactivas

```{warning}
En general Jupyter no es recomendable para tareas de producción. El flujo más correcto consiste en experimentar con Jupyter y luego escribir módulos. Veremos esto en detalle en una próxima sesión síncrona. 
```

Jupyter no es un reemplazo para una IDE completa como [*pycharm*](https://www.jetbrains.com/pycharm/) o [*vscode*](https://code.visualstudio.com/) o editores de texto como [*vim*](https://www.vim.org/) o [*emacs*](https://www.gnu.org/software/emacs/). Jupyter es un complemento.


**Ejemplos**

Revisa uno o más de los siguientes ejemplos para hacerte una idea de lo que se puede hacer con Jupyter

- Visualización de datos de censo (Estados Unidos): https://anaconda.org/jbednar/census/notebook
- Jupyter notebook sobre reacciones químicas: https://nbviewer.jupyter.org/gist/greglandrum/4316430
- Un libro de ciencia de datos escrito en jupyter: https://nbviewer.jupyter.org/github/gumption/Python_for_Data_Science/blob/master/Python_for_Data_Science_all.ipynb
- Un tutorial de GIT escrito en jupyter: https://nbviewer.jupyter.org/github/fperez/reprosw/blob/master/Version%20Control.ipynb


## ¿Cómo funciona Jupyter?


- El **servidor jupyter** es el encargado de administrar los `notebooks`
- Los usuarios interactuan con los `notebooks` a través de un frontend o interfaz web
- El proceso encargado de correr los códigos se denomina **kernel**
- El servidor conecta los notebooks con el kernel usando la librería de mensajería ZeroMQ

La siguiente figura muestra el flujo detallado

<img src="https://jupyter.readthedocs.io/en/latest/_images/notebook_components.png" width="600">

**¿Qué lenguajes puedo usar?**

Existen `kernels` de Python, Julia, Ruby, C y otros lenguajes

En este curso nos enfocaremos en el kernel Interactive Python (IPython)

IPython es un interprete de Python que ofrece varias mejoras tales como

- autocompletación de path y modulos
- acceso desde terminal a documentación y código fuente
- búsqueda histórica de comandos
- y las *magics* que serán vistas más adelante. 


**Notas**

- Existen otros frontends como por ejemplo [jupyter lab](https://jupyter.org/)
- Se puede acceder al kernel de ipython desde la terminal escribiendo el comando *ipython*
- Las figuras provienen de la documentación de jupyter, donde además encontrarán más detalles: https://jupyter.readthedocs.io/en/latest/architecture/how_jupyter_ipython_work.html

## Montando nuestro ambiente de cómputo interactivo

Escoge un directorio y clona el repositorio del curso

    git clone https://github.com/magister-informatica-uach/INFO147.git

Luego, utilizando conda creamos un ambiente 

    conda create -n info147
    
Activa el ambiente 

    conda activate info147
    
E instala jupyter y sus dependencias

    conda install jupyter
    
Finalmente inicia jupyter escribiendo en la terminal

    jupyter notebook
    
Esto abrirá una pestaña de navegador (browser) apuntada en la dirección

    localhost:8888

## Tutorial de Jupyter

### Componentes principales y atajos

- Pestañas: Files, Running y Clusters
- Encabezado: File, Edit, View, Insert, Cell, Kernel, Widgets, Help
- Tipo de celda: Código y Markdown
- Modos: Edición (verde) y Comando (azul)
- Atajos de texto (shortcuts)
    - Ejecución: <kbd>Shift+Enter</kbd> y <kbd>Ctrl+Enter</kbd>
    - Creación: <kbd>a</kbd> y <kbd>b</kbd>
    - Copiar y pegar celdas: <kbd>c</kbd> y  <kbd>v</kbd>
    - Cambio de tipo: <kbd>m</kbd> y <kbd>y</kbd>
    - Salvar: <kbd>Ctrl+s</kbd>
- Editor de texto y terminales (solo UNIX)

### Editando y ejecutando un bloque de código

La última línea de ejecución de un bloque se imprime como salida 

In [None]:
x = 1412043130
x

Las variables y módulos que se crean/importan en un bloque puede ser llamados desde otro bloque

In [None]:
x

Para imprimir otras lineas usamos print o display

In [None]:
print(2*x)
3*x

Se puede suprimir la salida terminando la expresión con ;

In [None]:
x;

### Ayuda y autocompletación en Jupyter

- Si escribes `?` después de un módulo se levantará el docstring de ese módulo
- Si escribes `??` después de un módulo se levantará el código fuente de ese código
- También puedes obtener ayuda con la función `help`

```python
from collections import Counter
Counter?
Counter??
help(Counter)
```

Por ejemplo

In [None]:
def funcion_interesante(x, y):
    """
    Esta es una función interesante que suma sus argumentos
    Argumentos: x, y
    """
    return x + y

Si escribes `funcion_interesante??` deberías ver una pestaña como la siguiente

<img src="img/jupyter2.png" width="850">

En un bloque de código puedes usar <kbd>TAB</kbd> para autocompletar nombres de variables, módulos o rutas 

También puedes usar <kbd>Shift+TAB</kbd> para levantar el docstring de una función

Si usas esto con `funcion_interesante` deberías ver algo como

<img src="img/jupyter1.png" width="700">

### "Magias" de IPython

Las magias son comandos especiales de IPython que se llama con el operador `%`

Las "magias" disponibles son

In [None]:
%lsmagic

Por ejemplo podemos medir el tiempo de ejecución de un bloque usando

In [None]:
%%time 
a = ''
for i in range(10):
    a += str(i)
print(a)

O mostrar las variables y librerías que hemos importado a nuestro entorno

In [None]:
%who

O los comandos que hemos escrito

In [None]:
%history

También podemos borrar las variables creadas y módulos importados con

In [None]:
%reset

Y setear variables de entorno

In [None]:
%env OMP_NUM_THREADS=4

entre mutras otras opciones útiles que iremos viendo a lo largo del curso

**Corriendo un script Python externo**

Podemos usar la magia `%run` para ejecutar un script externo

In [None]:
%run script_interesante.py

In [None]:
1*2*3*4*5*6*7*8*9*10

También podemos importar una función dentro de un módulo con

In [None]:
from script_interesante import funcion_interesante

funcion_interesante(10)

Si estamos trabajando en el módulo `script_interesante` es conveniente importarlo dinamicamente

De esta forma cualquier cambio que hagamos en el script se vera reflejado inmediatamente en el cuadernillo

Para uso debemos usar la magia `%autoreload`

Puedes consultar la ayuda de esta magia con `%autoreload?`

In [None]:
%load_ext autoreload
%autoreload 2
# Todo lo que importe a continuación podrá ser modificado dinamicamente
from script_interesante import funcion_interesante
funcion_interesante(10)

**Errores y debugging**

La magia `%debug` nos permite hacer debugging a nivel de bloque

Si se detecta un error se levanta automáticamente una interfaz de ipdb

```python
%debug
a = [1, 2, 3, 4]
a[10] # Esto lanzará ipdb
```

El anexo "Repaso de Python" tiene instrucciones breves para aprender a usar pdb/ipdb

**Accediendo al sistema operativo**

Usando el operador `!` podemos hacer llamados al sistema operativo dentro de nuestros bloques de código

Podemos usar `$` dentro de un comando para entregar variables de nuestro cuadernillo

Algunos ejemplos

In [None]:
mi_variable_interesante = 'asd'
!pwd
!echo $mi_variable_interesante
!cat script_interesante.py

También podemos usar la magía `%%bash` para acceder a comandos del sistema

In [None]:
%%bash
echo "Estoy usando:" $SHELL
echo "Mi path es:" $PATH
free -m
df -h

Podemos capturar el retorno de las funciónes llamadas con `!`

In [None]:
lista_archivos = !ls

print(lista_archivos)

Algunas funciones básicas de UNIX a tener con consideración:

- `pwd`: Retorna la ruta del directorio actual
- `ls foo`: Lista de los archivos y directorios en `foo`
- `rm foo`: Borrar el archivo `foo`
- `cd foo`: Moverse al directorio `foo`
- `cp foo bar`: Copiar el archivo `foo` como `bar`
- `mkdir/rmdir foo` Crear/Borrar directorio `foo`
- `cat foo`: Imprimir el contenido del archivo `foo`
- `head/tail -n10 foo`: Imprimir las primeras/últimas 10 lineas de `foo`
- `more foo`: Imprimir `foo` por partes
    