# Jupyter notebook
### Tutorial para instalação e utilização

## O que é Jupyter Notebook?

Nesse caso, "Notebook" denotam documentos que contêm elementos de código e _rich text_, como figuras, links, equações, e etc. Devido à combinação de elementos de código e texto, esse tipo de documento é ideal para: 
* Reunir uma descrição da análise de resultados
* realize a análise dos dados em tempo real
* Criar apresentações dinâmicas
* Criar documentações

**"Jupyter"** é uma sigla solta que significa **Ju**lia, **Pyt**hon **e R**.

A replicação e a reprodutibilidade são dois pilares do método científico. Os Jupyter notebooks facilitam a realização de ambos.

## Instalando o jupyter notebook

De dentro dentro do seu container, rode o seguinte comando:

```
$ conda install jupyter notebook
```

Para iniciar o `jupyter notebook`:

```
$ jupyter notebook
```

Após isso, acesse `jupyter notebook` pelo navegador (pode ser necessário copiar e colar o token):
http://localhost:8888

## Criando um notebook

Para criar um novo notebook, acesse o munu superior direito conforme a imagem:

<center><img src="https://advancedinstitute.ai/wp-content/uploads/2019/10/new.png" width="600" height="360"/></center>

## Extensão .ipynb

Por definição, a extensão padrão do Jupyter notebook é `.ipynb`. Esse arquivo é um `JSON`. Cada célula e conteúdo é convertida em _string_ e listada nesse arquivo. 

## Interface

Há dois termos bastante importantes: **células** e **kernels** são essenciais para entender o Jupyter e o que o torna mais do que apenas um processador de texto.

Um *Kernel* é um "mecanismo computacional" que executa o código contido em um documento do notebook.
Uma célula é um contêiner para o texto a ser exibido no bloco de notas ou o código a ser executado pelo kernel do bloco de notas.

 **Células** são blocos . Elas são blocos que podem ser executados individualmente

## Células

Um notebook é estruturado em **Células**. Elas são blocos que podem ser executados individualmente, porém sequencialmente. Existem dois tipos principais de células:

* Uma **célula de código** contém código a ser executado no kernel e exibe sua saída abaixo.
* Uma **célula Markdown** contém texto formatado usando Markdown e exibe sua saída no local quando é executada.

In [1]:
# Você pode mesclar texto, código e ver as saidas em tempo real
print('Hello World')

Hello World


Por definição, ao criarmos uma nova célula (clicando no botão `+` no menu superior ou utlizando a tecla `B`) ela será do tipo código.
Para alterarmos o tipo da célula, basta acessar o menu superior:

<center><img src="https://advancedinstitute.ai/wp-content/uploads/2019/10/cells.png" width="600" height="360"/></center>

## Atalhos

Para acessar a lista de atalhos, utilize a sequência
`CTRL + SHIFT + P`

## Rodando comandos shell de dentro do notebook

basta utilizar `!` antes do comando bash, conforme exemplo a seguir:

In [3]:
!whoami

rmcobe


## Usando o jupyter notebook para apresentações

Para visualizar como slides, é preciso ativar a opção de marcar o tipo visualização das células como `slideshow`
<center><img src="https://advancedinstitute.ai/wp-content/uploads/2019/10/slideshow.png" width="600" height="360"></center>

tipos de slides ( _Slide Type_ ):
* **Slide**: Exibição da célula como um slide
* **Sub-Slide**: Exibição da célula no mesmo slide, mas sobrepoe o conteúdo anterior
* **Fragment**: Exibição da célula abaixo da anterior
* **Skip**: A célula não será exibida
* **Notes**: Notas para o apresentador (não será exibida)

### RISE
#### Ferramenta de apresentação online

Instale a ferramenta RISE:

In [None]:
!conda install -c conda-forge rise -y

### Converter slide para `.pdf` (Relatório)

Para converter a apresentação para `.pdf` é necessário instalar o `xelatex`:
```
# sudo apt-get install texlive-xetex
```

### Convertendo o seu notebook para apresentação `html` ( _offline_ ):

!jupyter nbconvert jupyter-tutorial.ipynb --to slides --reveal-prefix  "https://cdnjs.cloudflare.com/ajax/libs/reveal.js/3.3.0"

## Magic Commands

In [4]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %colors  %conda  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %pip  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%

## Magic Commands

Definindo variável de ambiente com diretiva `%env`

In [15]:
%env OMP_NUM_THREADS=4

!echo $OMP_NUM_THREADS

env: OMP_NUM_THREADS=4
4


## Magic Commands

Utilizando o `%load` para carregar arquivo externo

In [22]:
# %load pythoncode.py
import numpy
def append_if_not_exists(arr, x):
    if x not in arr:
        arr.append(x)

def some_useless_slow_function():
    arr = list()
    for i in range(10000):
        x = numpy.random.randint(0, 10000)
        append_if_not_exists(arr, x)


## Magic Commands

Usando o `%who` para listar variáveis globais:

In [23]:
a, b, c = "var1", "var2", "var3"

def function1():
    a_prime = "var1_prime"
    pass

%who

a	 append_if_not_exists	 b	 c	 function1	 numpy	 some_useless_slow_function	 


## Magic Commands

Medindo o tempo com `%%time` e `%timeit`

In [24]:
%%time
import time
for _ in range(1000):
    time.sleep(0.01) # sleep for 0.01 seconds

CPU times: user 32.1 ms, sys: 34.4 ms, total: 66.5 ms
Wall time: 11.4 s


In [25]:
import numpy
%timeit numpy.random.normal(size=100)

12.4 µs ± 2.31 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)


## Magic Commands

Utilizando o `%%writefile` para escrita e o `%pycat` para inspecionar o conteúdo de um arquivo externo.

In [26]:
%%writefile pythoncode.py
import numpy
def append_if_not_exists(arr, x):
    if x not in arr:
        arr.append(x)

def some_useless_slow_function():
    arr = list()
    for i in range(10000):
        x = numpy.random.randint(0, 10000)
        append_if_not_exists(arr, x)


Overwriting pythoncode.py


In [30]:
%pycat pythoncode.py

## Magic Commands

Depurando utilizando o `%prun`

In [29]:
%prun some_useless_slow_function()

 