# Anaconda

https://docs.continuum.io/anaconda/

Distribuição de pacotes Python voltada para as ciências de dados. 

Possui ferramenta para gerenciar os pacotes(instalar, atualizar, remover, resolver dependências), versões do Python e criação de ambientes virtuais. 

Já vem com um conjunto de pacotes instalados, dentre eles o Jupyter, numpy, pandas e spyder, e ferramentas, como o spyder(IDE) e orange(app like weka).

Lista de pacotes disponíveis: https://docs.continuum.io/anaconda/pkg-docs.html

## Comandos para gerenciamento de pacotes

* conda list 
* conda search package_name(pode ser apenas uma parte)
* conda update package_name
* conda remove scikit-learn
* conda update --all
* conda install package_name

Possui também uma interface gráfica: anaconda-navigator

# Jupyter

http://jupyter.org/

Ambiente de desenvolvimento composto por ferramentas como Jupyter Notebook e Jupyter QtConsole, que inclui ferramentas como autocomplete, code highlight, visualização inline etc.

# Jupyter Notebook

Aplicação web que permite desenvolver documentos(notebooks) que mesclam código, texto formatado, Latex, visualizações, HTML etc.

**comando**:

jupyter notebook

**Shortcuts**:

* **crtl+enter** -> executa a célula e mantém a célula atual selecionada
* **shift+enter** -> executa a célula e seleciona a próxima célula
* **esc** -> vai para o modo de comando
* **enter** ou clicar na célula -> vai para o modo de entrada
* **setas** para mover entre as células
* no modo de comando:
   * **a** -> abre uma célula acima da célula selecionada
   * **b** -> abre uma célula abaixo da célula selecionada
   * **m** -> altera o tipo da célula atual para markdown
   * **y** -> altera o tipo da célula atual para código
   * **dd** ou **x** -> exclui a célula atual -> pode ser desfeito com Edit > Undo Delete Cells
   * **space/shift+space** -> move o notebook
   
**Menu**

* Cell > Run All
* Cell > Current Output/All Outputs > Clear

## Output representação string do objeto

In [1]:
from numpy.random import randn

a = {"b": "c", "d": randn(), "c": {"a": "hehe", "e": {"f": {i : randn() for i in range(4)}}}}

a

{'b': 'c',
 'c': {'a': 'hehe',
  'e': {'f': {0: -0.3683474254624129,
    1: -0.6767237897173507,
    2: -0.5410829488723763,
    3: 0.2554400298478532}}},
 'd': -1.265988328253152}

In [2]:
from pprint import pprint

pprint(a, depth=2)

{'b': 'c', 'c': {'a': 'hehe', 'e': {...}}, 'd': -1.265988328253152}


## Tab completion

In [3]:
minha_variavel = 26
minha_variable = 27

In [None]:
minha # tab

In [4]:
# autocomplete com objeto
lista = [1, 2, 3]

In [20]:
lista. # tab

[1, 2, 3]

In [None]:
# autocomplete com módulos

import datetime

datetime. # tab
datetime._ # por default atributos e métodos inicializados por underscore não são apresentados

In [None]:
# autocomplete com paths do filesystem

../../data # tab

## Introspection

In [5]:
?lista # informações gerais sobre o objeto

In [9]:
def soma(a, b):
    
    return a + b

In [16]:
??soma # se disponível, apresenta o código

## Pesquisa em métodos e atributos de um objeto/módulo

In [6]:
import numpy as np

?np.*load* # * wildcard

In [7]:
?np.lo*

## Executando script

In [8]:
!cat script1.py


print("Fala galera da STI!")

In [9]:
%run script1.py # executado sem acesso às variáveis e imports dessa sessão

Fala galera da STI!


In [10]:
!cat script2.py


print(nome)

In [11]:
nome = "joão"

%run -i script2.py # executado com acesso às variáveis e imports dessa sessão

joão


## Interrompendo a execução de uma célula

In [12]:
import time

def demora_muito():
    
    for _ in range(100):
        
        time.sleep(5)

In [13]:
demora_muito() # botão interrupt kernel

KeyboardInterrupt: 

## Magic commands

* obs: os magic commands podem ser utilizados sem % - se não houver ambiguidade

In [14]:
%quickref

In [15]:
import numpy as np

In [16]:
%%time

np.dot(np.random.randn(2, 30), np.random.randn(30, 2))
# CPU time > tempo de execução em CPU
# Wall time > tempo passado desde o envio do comando até a resposta

CPU times: user 0 ns, sys: 0 ns, total: 0 ns
Wall time: 2.02 ms


array([[-1.12604192, -0.14631003],
       [ 5.03126146,  0.12620347]])

In [17]:
%%timeit

np.dot(np.random.randn(100, 100), np.random.randn(100, 100))

1000 loops, best of 3: 870 µs per loop


In [18]:
%who

a	 demora_muito	 lista	 minha_variable	 minha_variavel	 nome	 np	 pprint	 randn	 
time	 


In [19]:
%reset -f

In [20]:
%who

Interactive namespace is empty.


In [21]:
%hist

from numpy.random import randn

a = {"b": "c", "d": randn(), "c": {"a": "hehe", "e": {"f": {i : randn() for i in range(4)}}}}

a
from pprint import pprint

pprint(a, depth=2)
minha_variavel = 26
minha_variable = 27
# autocomplete com objeto
lista = [1, 2, 3]
?lista # informações gerais sobre o objeto
import numpy as np

?np.*load* # * wildcard
?np.lo*
!cat script1.py
%run script1.py # executado sem acesso às variáveis e imports dessa sessão
!cat script2.py
nome = "joão"

%run -i script2.py # executado com acesso às variáveis e imports dessa sessão
import time

def demora_muito():
    
    for _ in range(100):
        
        time.sleep(5)
demora_muito() # botão interrupt kernel
%quickref
import numpy as np
%%time

np.dot(np.random.randn(2, 30), np.random.randn(30, 2))
# CPU time > tempo de execução em CPU
# Wall time > tempo passado desde o envio do comando até a resposta
%%timeit

np.dot(np.random.randn(100, 100), np.random.randn(100, 100))
%who
%reset -f
%who
%hist


## Histórico de output

In [22]:
10 + 23

33

In [35]:
_ # último output

33

In [40]:
_22 # _X -> output, onde X é o número da célula

33

In [41]:
_i22 # _iX -> input, onde X é o número da célula

'10 + 23'

In [46]:
a = 10 + 33

a

43

In [43]:
_i # último input

'a = 10 + 33\n\na'

In [47]:
exec(_i) # reexecuta o input

## Log

In [48]:
%logstart

Activating auto-logging. Current session state plus future input saved.
Filename       : ipython_log.py
Mode           : rotate
Output logging : False
Raw input log  : False
Timestamping   : False
State          : active


In [49]:
!head ipython_log.py

# IPython log file

from numpy.random import randn

a = {"b": "c", "d": randn(), "c": {"a": "hehe", "e": {"f": {i : randn() for i in range(4)}}}}

a
from pprint import pprint

pprint(a, depth=2)


In [50]:
%logstop

## Execução de comandos do sistema operacional

In [51]:
!ls

2.1 - Jupyter.ipynb  ipython_log.py	  script1.py
2.2 - Spyder.ipynb   ipython_log.py.001~  script2.py


In [52]:
arquivos = !ls

arquivos

['2.1 - Jupyter.ipynb',
 '2.2 - Spyder.ipynb',
 'ipython_log.py',
 'ipython_log.py.001~',
 'script1.py',
 'script2.py']

In [53]:
%pwd

'/home/abevieiramota/Documents/github-repos/course-python-data-analysis/02 - Ferramentas'

In [54]:
folder = "../00\ -\ Exemplos/"

!ls $folder

0.1 - FCPC - Básico.ipynb  0.1 - FCPC - Intermediário.ipynb


# Jupyter QtConsole

Aplicação em Qt do Jupyter. Igual a um console Python/IPython, mas adicionado de features do Jupyter, como visualização inline e os magic commands.

**comando**:

jupyter qtconsole