---


--- 


# Introdução

O *Jupyter Notebook* é a maneira que optei para escrever os códigos na linguagem *Python*, visto que além de rodar os códigos, é possível:
1. Documentar os *scripts*, escrevendo o singnificado e objetivo de cada conjunto de comandos;
2. Atualizar os meus repositórios na plataforma **GitHub**;
3. Trabalhar com uma diversidade de opções de exportação do arquivo em formatos diversos, adaptados até mesmo para as simples leitura, como PDFs e Markdowns.

É no procesos de exportação dos arquivos que eu me ative nessa publicação, pois um dos objetivos de longo prazo que busco é exportar relatórios padronizados, para distribuição geral e irrestrita, ou seja, quero algo que não seja inteligível apenas por pessoas que conhecem de programação.

Para isso foram aqui apresentados um diversidade de opções para exportação de um arquivo *.ipynb*, sendo possível:
- Incluir apenas campos determinados;
- Incluir apenas as células que tenham determinada *tag*;
- Incluir apenas as células de *markdown*;
- Excluir as células de *outputs*.

In [None]:
import os
import json
import time
import folium
import pandas as pd
from datetime import date

In [None]:
os.makedirs('docs', exist_ok=True)

# Get *Jupyter Notebook* filename

Testei diversos comandos para obter o nome do *Jupyter Notebook* em uma variável. A melhor opção que encontrei estava nesse [*post*](https://stackoverflow.com/questions/12544056/how-do-i-get-the-current-ipython-jupyter-notebook-name) que tem diversas outras opções.

In [None]:
#https://getbootstrap.com/docs/4.0/components/alerts/

In [None]:
%%javascript

var kernel = IPython.notebook.kernel;
var body = document.body, attribs = body.attributes;
var command = 'ipynb_filename = ' + '"' + attribs['data-notebook-name'].value + '"';
kernel.execute(command);

In [None]:
ipynb_filename

In [None]:
%%javascript

var kernel = IPython.notebook.kernel;
var nb = IPython.notebook;
var command = 'ipynb_pathname = ' + '"' + nb.base_url + nb.notebook_path + '"';
kernel.execute(command);

In [None]:
ipynb_pathname

In [None]:
#%run '../codes/files/get_jupyternotebook_name.py'
#name = get_jupyternotebook_name()
#name

# Funções

## Variáveis em *Markdowns*
Para inserir uma variável em uma célula markdow para eu inserir a variável entre colchetes duplos, por exemplo {{a}}. Logo, se eu alterar o valor de a para qualquer um terei que **a={{a}}**.

In [None]:
a = 10

O mesmo pode ser feito com tabelas. Em tentativa de inserir tabelas diretamente do Pandas não obtive sucesso... Depois temos dataframe modificado pelo *.to_html()*, [função](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_html.html) que fornece várias opções a serem exploradas.
{{df_html}}

In [None]:
df = pd.DataFrame({"A": [1.0, 2.2, 3.6666], "B": [4.12134, 5.674, 6.13215]})

In [None]:
df_html = df.to_html(index=False, decimal='.', notebook=True, justify='center')
df_html = df_html.replace('\n', '')
df_html

## Linhas de Tabelas

Descobri que [nesse *post*](https://stackoverflow.com/questions/38783027/jupyter-notebook-display-two-pandas-tables-side-by-side) que é possível trabalhar para inserir também mais de uma tabela alinhada.

In [None]:
import pandas as pd
import numpy as np
from IPython.display import display, HTML

CSS = """
.output {
    flex-direction: row;
}
"""

HTML('<style>{}</style>'.format(CSS))

In [None]:
display(df)
display(df)
display(df)

## Comandos do Sistema

Praticamente  qualquer  comando  do  sistema  pode  ser  acessado  usando previamente **!**,  o  qual  passa qualquer comando subsequente diretamente para o sistema operacional. Você pode até usar variáveis python em comandos enviados para o sistema operacional!

In [None]:
!ls

In [None]:
file_type ='ipynb'

!ls ./*$file_type

## HTML

In [None]:
%%HTML
This is <em>really</em> neat!

# Referêcias

Há muita informação na internet sobre funcionalidades do *Jupyter Notebook*. Apenas para exemplificar, usei particialmente algumas das funções e truques apresentados em [**Jupyter Notebook Extensions**](https://towardsdatascience.com/jupyter-notebook-extensions-517fa69d2231) e [**28 Jupyter Notebook Tips, Tricks, and Shortcuts**](https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts).

---

# Exportando o _Juptyter Notebook_

O arquivo _.ipynb_ pode ser exportado em formatos diversos. Abaixo carrego uma função que escrevi para facilitar o processo de exportação do arquivo em diferentes locais do PC para, posteriormente, atualizar os repositórios contidos no <a title="Link do GitHub" href="https://github.com/michelmetran" target="_blank">*GitHub*</a>.

Com as funções para exportar o _Jupyter Notebook_ e para obter o nome do arquivo _.ipynb_ carregadas, basta exportar o arquivo, inicialmente para a pasta _docs_ dentro do projeto e também, visando atualizar os _posts_ do site, para a respectiva pasta.

-------------

Os arquivos Jupyter Notebook podem ser exportados em diversos formatos, seja através do menu de opções, ou através dos comandos. Ao exportar, é possível definir diversas opções que limitam o que será exportado, podendo escolher determinados tipos de células ou, até mesmo, células invidivuais. 

No *post* [Jupyter Notebook nbconvert without Magic Commands/ w/o Markdown](https://stackoverflow.com/questions/57701538/jupyter-notebook-nbconvert-without-magic-commands-w-o-markdown) é apresentado algumas opções de exportação. Incorporei várias delas no script *../codes/files/export_jupyter.py*. Ainda existem outras opções que não estudei a finalidade, listadas a seguir:

1. *--stdout*
2. *--TemplateExporter.exclude_input_prompt=True*
3. *--TagRemovePreprocessor.remove_input_tags = {"hide"}*

In [None]:
# Parâmetros
today = date.today().strftime('%Y-%m-%d')
today = '2020-06-11'

# Input/ Output
inp = 'jupyter.ipynb'
#out = os.path.join('docs', today + '-' + inp.split('.')[0])
out = os.path.join('docs', inp.split('.')[0])

# Exportar para
ext = 'python'                        # 'html', 'markdown', 'latex', 'pdf', 'python'

# Remover células taggeadas com:
tag = 'remove_cell'

In [None]:
!jupyter-nbconvert $inp\
--to $ext\
--TagRemovePreprocessor.enabled=True\
--TagRemovePreprocessor.remove_cell_tags='["'$tag'"]'\
--ClearOutputPreprocessor.enabled=True\
--TemplateExporter.exclude_markdown=False\
--TemplateExporter.exclude_code_cell=False\
--TemplateExporter.exclude_output=True\
--TemplateExporter.exclude_raw=False\
--TemplateExporter.exclude_input_prompt=True\
--output $out

Outro maneira é

https://stackoverflow.com/questions/53060589/how-to-download-from-jupyter-notebook-without-extra-comments

In [None]:
out = os.path.join('docs', 'jupyter')
tag = "['remove_cell']"

os.system('jupyter-nbconvert jupyter.ipynb\
          --to pdf\
          --TagRemovePreprocessor.enabled=True\
          --ClearOutputPreprocessor.enabled=True\
          --TemplateExporter.exclude_markdown=False\
          --TemplateExporter.exclude_code_cell=True\
          --TemplateExporter.exclude_output=True\
          --TemplateExporter.exclude_raw=False\
          --TemplateExporter.exclude_input_prompt=True\
          --TemplateExporter.exclude_output_prompt=True\
          --TagRemovePreprocessor.remove_cell_tags="'+ tag +'"\
          --output '+ out)

Ainda tem essa função

In [None]:
%run '../codes/files/export_jupyter.py'

export_jupyter(ipynb_filename, 'docs', ['html', 'markdown', 'pdf', 'python'], False)

In [None]:
import nbformat
import nbconvert
from nbconvert import HTMLExporter, PythonExporter
from nbconvert.writers import FilesWriter
from pathlib import Path

In [None]:
#pip install notebooktoall
#https://github.com/notebooktoall/notebooktoall/blob/master/notebooktoall/transform.py

In [None]:
from notebooktoall.transform import transform_notebook

transform_notebook(ipynb_file=ipynb_filename, export_list=['html', 'py'])

Usando pandoc descobri que dá pra exportar para **.doc**! Não ficou tão bom, mas ajuda!

In [None]:
file_wo_ext = ipynb_filename.split('.')[0]
file_md = file_wo_ext+'.md'
file_doc = file_wo_ext+'.docx'

file_doc = os.path.join('docs', file_doc)
file_md = os.path.join('docs', file_md)

In [None]:
!pandoc -o $file_doc -f markdown -t docx $file_md --reference-links

# GitHub

A partir do *post* [**How to Git Jupyter Notebooks the Right Way**](http://mateos.io/blog/jupyter-notebook-in-git), compreendi que é considerada como *best pratices* no git de projetos escritos em *Jupyter Notebook* a aplicação de um determinado código usando o package *nbstripout*, conforme apresentado abaixo. No vídeo [**nbstripout: strip output from Jupyter and IPython notebooks**](https://www.youtube.com/watch?v=BEMP4xacrVc) é explicado detalhadamente como o comando atua.

In [None]:
!nbstripout --install --attributes .gitattributes

In [None]:
#os.system('nbstripout --install --attributes .gitattributes')

Criei uma função para exportar o *Jupyter Notebook* em diversos formatos. Aproveitei para incorporar o comando do ```nbstripout``` na função que faz o *commit*, visando simplificar as coisas.

In [None]:
!nbstripout --install --attributes .gitattributes
!git status
!gitt add .
!git commit -m 'sss'
!git push

In [None]:
%run '../codes/git/update_github.py'

git_full('.', '.', 'Atualizando')

Após as exportações dos arquivos nos formatos necessários, basta atualizar o repositório diretamente pelo  *Jupyter Notebook*.
Abaixo é atualizado o repositório desse projeto específico, bem como a derivação desse projeto no <a title="Link do Folium" href="https://michelmetran.github.io/" target="_blank">**_site_**</a>.

# *Requirements*

O comando ```pip freeze``` é o mais difundido na internet para se obter os *requirements.txt*, ou seja, o arquivo com o qual é possível indicar quais os *packages* necessários para rodar um determinado *script*.

In [None]:
pip freeze > requirements.txt

Tentei usar também o package ```pipreqs```, porém ele não funciona em *Juptyter Notebook*. Descobri ainda que o comando ``` conda env export > environment.yml``` pode auxiliar na criação destes parâmetros.

In [None]:
# Cria o mapa
m = folium.Map(
    location=[-23.9619271,-46.3427499],
    zoom_start=12)

In [None]:
#pip install pipreqs

In [None]:
!pipreqs 'docs' --force --debug --print

# Erros

Em uma tentativa de exportar o *Jupyter Notebook* para PDF tive problemas. O arquivo não era exportado e apresentava a seguinte mensagem de erro:
- *nbconvert failed: xelatex not found on PATH, if you have not installed xelatex you may need to do so. Find further instructions at https://nbconvert.readthedocs.io/en/latest/install.html#installing-tex.*

Para solucionar, descobri que é necessário instalar, no Linux, akguns pacotes de aplicativos com os seguintes comandos, sendo o primeiro uma instalação mais compacta e o segundo uma instalação completa.

```sudo apt-get install texlive-xetex texlive-fonts-recommended texlive-generic-recommended```

```sudo apt-get install texlive-full```

___

# Encerramento

## *Export to*  docs

In [None]:
# Input
inp = 'jupyter.ipynb'

# Output
out = os.path.join('docs', inp.split('.')[0])

# Extension to export ('html', 'html_embed', 'markdown', 'latex', 'pdf', 'python')
ext = 'html_embed'

# Remove cells with tag
tag = ("['" + '"remove_cell"' + ", " + '"yaml"' + "']")
!echo $tag

In [None]:
!jupyter-nbconvert $inp\
--to $ext\
--TagRemovePreprocessor.enabled=True\
--TagRemovePreprocessor.remove_cell_tags=$tag\
--ClearOutputPreprocessor.enabled=True\
--TemplateExporter.exclude_markdown=False\
--TemplateExporter.exclude_code_cell=False\
--TemplateExporter.exclude_output=True\
--TemplateExporter.exclude_raw=False\
--TemplateExporter.exclude_input_prompt=True\
--TemplateExporter.exclude_output_prompt=True\
--output $out