# Como usar o Jupyter Notebook

### O que é o Jupyter Notebook?

Jupyter Notebook é uma ferramenta online de código aberto que nos permite criar e compartilhar documentos que misturam código, equações, visualizações (imagens ou gráficos) e texto. Os Notebooks possuem milhares de utilidades no aprendizado e no ensino de diversas áreas, tais como as geociências, ciência de dados, estatística e até mesmo as humanidades.

### Criando um novo Notebook

Para começar devemos criar um novo Notebook. Podemos fazer isso indo na barra de cima em *File*, e depois em *New Notebook*, ou clicando em *New* no canto superior direito da tela inicial do Jupyter Notebook. O Notebook que criamos abrirá em uma nova guia do navegador e também aparecerá na lista de notebooks na tela inicial.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

Ao criarmos um novo notebook, veremos em nossa tela o nome do notebook e uma barra de menu e de ferramentas na parte superior da tela, e, logo abaixo deles, uma célula de código vazia. 

![image.png](attachment:image.png)

Para mudar o título do notebook basta clicar no título. Em seguida abrirá uma caixa que nos permite digitar o nome que queremos dar ao nosso novo documento.

### Estrutura de um Notebook

Um notebook nada mais é que uma sequência de células. Uma célula é basicamente um espaço onde podemos escrever diversas linhas de código ou texto, por exemplo. Existem três tipos de célula: células de código, células de markdown, e células de raw NBconvert. Ao inserirmos uma nova célula ela sempre é inicialmente uma célula de código, mas podemos mudar isso clicando em Cell na barra de menu e depois em Cell Type, e em seguida selecionando o tipo de célula que queremos. Para executar o conteúdo de uma célula, seja ela de qualquer um dos três tipos, clicamos no botão de Run, na barra de menu, ou então apertamos os botões shift e enter do teclado ao mesmo tempo.

#### Células de Código

As células de código são aquelas que nos permitem escrever, editar e executar códigos de uma determinada linguagem, em geral Python.

#### Células de Markdown

As células de markdown são aquelas que aceitam a linguagem de marcação Markdown, que nos permite a edição de textos.

Para fazer um título numa célula de markdown utilizamos de um a seis hashtags (#) , seguidos de um espaço e, em seguida, do texto do título.

Podemos também inserir fórmulas matemáticas em células de markdown, com a notação de LaTeX, utilizando um ou dois $ no começo e no fim da fórmula. Por exemplo:

![image.png](attachment:image.png)


#### Células de Raw NBconvert

As células de Raw NBconvert são aquelas que permitem a execução de códigos externamente, como o LaTeX, por exemplo.

### Inserindo novas células

Podemos acrescentar uma nova célula acima ou abaixo de qualquer dada célula, indo em Insert e clicando em insert cell above ou insert cell below.

### Inserindo imagens no Notebook

Para inserir imagens no notebook devemos primeiro fazer o upload da imagem na pagina inicial do Jupyter Notebook. Fazemos isso clicando em *Upload* na parte superior direita da tela.

![image.png](attachment:image.png)

A seguir, selecionamos a imagem a ser inserida no notebook e confirmamos. Após isso é só criar uma célula de markdown no notebook e escrever um ponto de exclamação seguido de title entre colchetes e o nome do arquivo entre parentesis.

![image.png](attachment:image.png)

### Números e operações básicas

Podemos fazer cálculos no notebook, assim como fariamos em uma calculadora, apenas escrevendo a operação em uma célula de código e clicando em *Run*. Por exemplo:

In [1]:
#soma
3+5

8

In [2]:
#subtração
7-4

3

In [3]:
#multiplicação
5*20

100

In [4]:
#divisão
120/6

20.0

In [5]:
#divisão inteira
100//3

33

In [6]:
#potência
2**3 

8

### Bibliotecas

Bibliotecas são extensões de linguagem que podemos utilizar nos notebooks. A linguagem de Python possui diversas bibliotecas, especializadas em tarefas específicas, que nos são muito úteis. Algumas das principais bibliotecas que podemos utilizar são Numpy, Matplotlib e Pandas.

### Numpy

Numpy é uma biblioteca utilizada para trabalhar com arrays. Arrays são basicamente uma variável especial que possui mais de um valor ao mesmo tempo, como se fosse uma lista.

Para usar numpy primeiro precisamos importar a biblioteca. Fazemos isso digitando import numpy em uma célula de código. Em geral mudamos o nome de numpy para np.

In [7]:
import numpy as np

O objeto em Numpy, ou seja, os arrays, são chamados de ndarray. Podemos criar um ndarray através da função array():

In [8]:
import numpy as np
arr = np.array([1,2,3,4,5])
print(arr)

[1 2 3 4 5]


#### Dimensões em Arrays

Podemos ter arrays dentro de arrays, e, nesse caso, teremos dimensões nos arrays. Uma dimensão seria um nível de profundidade dentro de um array, ou seja, cada array dentro daquele array corresponderia a uma dimensão. Um array pode ter qualquer número de dimensões. Alguns exemplos são:

- _**Arrays 0-D:**_ são os elementos do array. Cada valor é um array de dimensão 0-D.

In [9]:
import numpy as np
arr = np.array(13)
print(arr)

13


- _**Arrays 1-D:**_ é um array em que seus elementos correspondem a arrays 0-D. São os arrays mais básicos e comuns.

In [10]:
import numpy as np
arr = np.array([3,6,9,12])
print(arr)

[ 3  6  9 12]


- _**Arrays 2-D:**_ são aqueles que possuem arrays 1-D como seus elementos e são frequentemente utilizados para representar matrizes.

In [11]:
import numpy as np
arr = np.array([[1,2,3],[4,5,6]])
print(arr)

[[1 2 3]
 [4 5 6]]


- _**Arrays 3-D:**_ são aqueles que possuem arrays 2-D, ou seja matrizes, comos seus elementos. No exemplo a seguir temos, dentre os elementos do array 3-D, o primeiro array 2-D contendo 1,2,3 e 4,5,6 e o segundo, contendo 7,8,9 e 10,11,12.

In [12]:
import numpy as np
arr = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
print(arr)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]


Podemos também verificar o número de dimensões de um array com o comando ndim:

In [13]:
import numpy as np
arr = np.array([1,2,3,4,5])
print(arr.ndim)

1


#### Acessando elementos específicos de um array

Podemos acessar um elemento específico de qualquer array ao nos referirmos ao número do índice deste elemento. Os índices em python começam em zero, significando que o índice do primeiro elemento será sempre zero, o segundo será um, e assim sucessivamente.

In [14]:
#Um exemplo de como acessar um elemento específico de um array (quarto elemento):
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(arr[3]) 

4


In [15]:
#Acessando mais de um elemento:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(arr[3], arr[5], arr[6]) 

4 6 7


In [16]:
#Acessando dois elementos e somando eles:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(arr[3] + arr[7]) 

12


Para acessarmos um elemento especifico em um array 2-D, referenciamos primeiro o número da dimensão, e, separado por vírgula, o índice do elemento.

In [17]:
#Acessando elementos em arrays 2-D (3º elemento na 1ª dimensão)
import numpy as np
arr = np.array([[1,2,3],[4,5,6]])
print(arr[0, 2])

3


Para acessarmos um elemento especifico em um array 3-D, devemos referenciar, separados por vírgula, primeiro as dimensões e, em seguida, o índice do elemento.

In [18]:
import numpy as np
arr = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
print(arr[0,1,1])

5


#### Cortando arrays

Podemos "cortar" um pedaço dos arrays através do método slicing(). Para fazer isso, colocamos o índice dos elementos que então no início e no fim do grupo de elementos que desejamos tirar do array desta forma: [ínicio:fim]. Se não colocarmos o início ele é considerado 0, e se não colocarmos o fim, ele é considerado o último elemento do array.

In [19]:
#exemplo:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(arr[1:5]) #note que no resultado final o último elemento que selecionamos não é incluido

[2 3 4 5]


Em arrays 2-D, precisamos escrever a dimensão antes dos índices dos elementos.

In [20]:
#exemplo:
import numpy as np
arr = np.array([[1,2,3,4,5],[1,2,3,4,5]])
print(arr[0, 2:6])

[3 4 5]


#### Tipos de dados

Em Python os tipos de dados que temos são: strings (texto - representamos entre aspas), integer (números inteiros), float (números reais), boolean (verdadeiro ou falso), complex (números complexos). Em Numpy, esses tipos de dados podem ser representados com apenas uma letra, ou seja, string = S, integer = i, float = f, boolean = b, e complex = c.

Podemos verificar o tipo de dados contidos em qualquer array através do comando dtype.

In [21]:
#exemplo
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(arr.dtype)

int32


Podemos também criar arrays definindo o tipo de dados que eles terão, acrescentando o argumento dtype à função array().

In [22]:
import numpy as np
arr = np.array([1, 2, 3, 4], dtype='S')
print(arr)
print(arr.dtype)

[b'1' b'2' b'3' b'4']
|S1


Além disso, podemos converter o tipo de dados de um array já existente, fazendo uma cópia do array com a função astype(). 

In [23]:
#exemplo
import numpy as np
arr = np.array([1.1,2.3,5.5,7.6])

newarr = arr.astype('i')

print(newarr)

[1 2 5 7]


#### Criando uma cópia de um array

Podemos criar uma cópia de um array com a função copy(), assim, poderemos alterar a cópia, mas o array original permanecerá intacto e vice versa.

In [24]:
#exemplo
import numpy as np
arr = np.array([1,2,3,4,5])
x = arr.copy()
x[0] = 10 #aqui mudamos o primeiro elemento da cópia para 10

print(arr)
print(x)

[1 2 3 4 5]
[10  2  3  4  5]


#### Número de elementos

Podemos descobrir o número de elementos em cada dimensão de um array através do comando shape, que nos dará como resultado primeiro o número de dimensões e, em seguida, o número de elementos de cada dimensão.

In [25]:
#exemplo:
import numpy as np
arr = np.array([[1,2,3,4,5],[1,2,3,4,5]])
print(arr.shape)

(2, 5)


Podemos também alterar o número de elementos em cada dimensão, bem como adicionar ou remover dimensões do array.

In [26]:
#convertendo um array 1D em um array 2D
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8,9,10,11,12])

newarr = arr.reshape(4, 3) #transformará num array que contenha 4 arrays, cada um com 3 elementos
print(newarr)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]


In [27]:
#convertendo um array 1D em um array 3D
import numpy as np
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])

newarr = arr.reshape(2, 3, 2) #teremos um array com 2 arrays, que irão conter 3 arrays com 2 elementos cada
print(newarr)

[[[ 1  2]
  [ 3  4]
  [ 5  6]]

 [[ 7  8]
  [ 9 10]
  [11 12]]]


Além disso, podemos transformar um array multidimensional qualquer em um array unidimensional, utilizando a função reshape(-1).

In [28]:
#convertendo um array 2D em um array 1-D
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])

newarr = arr.reshape(-1)
print(newarr)

[1 2 3 4 5 6]


#### Juntando arrays

Podemos juntar os elementos de dois ou mais arrays em um só, colocando os arrays que desejamos unir na função concatenate() junto com o axis, que é o número de dimensões. Se não definirmos o axis ele será automáticamente 0.

In [29]:
#exemplo
import numpy as np
arr1 = np.array([1,2,3])
arr2 = np.array([4,5,6])

arr = np.concatenate((arr1, arr2)) #como não definimos o axis ele será 0, logo, será um array 1D
print(arr)

[1 2 3 4 5 6]


In [30]:
#exemplo com arrays 2D e axis = 1
import numpy as np
arr1 = np.array([[1,2], [3,4]])
arr2 = np.array([[5, 6], [7, 8]])

arr = np.concatenate((arr1, arr2), axis=1) #com axis=1, teremos um array 2D
print(arr)

[[1 2 5 6]
 [3 4 7 8]]


Podemos também juntar arrays através da função stack(). A diferença entre concatenate() e stack() é que stack() fará em uma nova dimensão, ou seja, colocando um array "em cima" do outro. Assim como na função concatenate(), na função stack() devemos colocar os arrays que desejamos juntar, bem como o axis. Se não especificarmos o axis ele será automáticamente 0.

In [31]:
#exemplo
import numpy as np 
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr = np.stack((arr1, arr2))
print(arr)

[[1 2 3]
 [4 5 6]]


In [32]:
#exemplo com axis=1
import numpy as np 
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr = np.stack((arr1, arr2), axis=1)
print(arr)

[[1 4]
 [2 5]
 [3 6]]


Temos também a função hstack(), para empilhar arrays em linhas, ou seja, na horizontal.

In [33]:
import numpy as np
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr = np.hstack((arr1, arr2))
print(arr)

[1 2 3 4 5 6]


E a função vstack() para empilhar arrays em colunas, ou seja, na vertical.

In [34]:
import numpy as np
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr = np.vstack((arr1, arr2))
print(arr)

[[1 2 3]
 [4 5 6]]


Além da função dstack(), para empilhar em função da altura, ou profundidade.

In [35]:
import numpy as np
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr = np.dstack((arr1, arr2))
print(arr)

[[[1 4]
  [2 5]
  [3 6]]]


#### Dividindo arrays

Dividir arrays é a operação inversa de juntar arrays, sendo assim, enquanto juntar arrays fará 2 ou mais arrays se transformarem em um só, dividir arrays separará um único array em vários. Fazemos isso através da função array_split(), colocando nela o array a ser dividido e o número de divisões que desejamos realizar, ou seja, o número de arrays que queremos. O resultado final será um array contendo os arrays resultantes da divisão.

In [36]:
#exemplo: dividindo um array em 3 partes
import numpy as np
arr = np.array([1, 2, 3, 4, 5, 6])

newarr = np.array_split(arr, 3) 
#note que o resultado final será um array contendo 3 arrays, pois pedimos 3 divisões no array original
print(newarr)

[array([1, 2]), array([3, 4]), array([5, 6])]


Podemos também acessar os arrays resultantes da divisão, mesmo que estejam dentro do nosso array final.

In [38]:
#exemplo:
import numpy as np
arr = np.array([1, 2, 3, 4, 5, 6])

newarr = np.array_split(arr, 3) 

print(newarr[0])
print(newarr[1])
print(newarr[2])

[1 2]
[3 4]
[5 6]


Podemos fazer o mesmo com arrays 2D, mas neste caso podemos também acrescentar o axis no qual desejamos fazer a divisão.

In [39]:
#exemplo em array 2D sem especificar o axis:
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15], [16, 17, 18]])

newarr = np.array_split(arr, 3)

print(newarr)

[array([[1, 2, 3],
       [4, 5, 6]]), array([[ 7,  8,  9],
       [10, 11, 12]]), array([[13, 14, 15],
       [16, 17, 18]])]


In [40]:
#exemplo em array 2D com axis = 1
import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15], [16, 17, 18]])

newarr = np.array_split(arr, 3, axis=1) 
#outra forma de fazer isso é utilizar hsplit() com o nome do array e nº de divisões, ou seja np.hsplit(arr, 3)

print(newarr)

[array([[ 1],
       [ 4],
       [ 7],
       [10],
       [13],
       [16]]), array([[ 2],
       [ 5],
       [ 8],
       [11],
       [14],
       [17]]), array([[ 3],
       [ 6],
       [ 9],
       [12],
       [15],
       [18]])]


#### Pesquisando em arrays

Podemos pesquisar um valor específico em um array, e receber como resultado os índices dos elementos correspondentes naquele array, através da função where().

In [41]:
#encontrar os índices em que o valor do elemento é 4:
import numpy as np
arr = np.array([1,2,3,4,5,4,4])

x = np.where(arr == 4)
print(x)

(array([3, 5, 6], dtype=int64),)


In [42]:
#encontrar os índices em que os valores dos elementos são pares:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])

x = np.where(arr%2 == 0)
print(x)

(array([1, 3, 5, 7], dtype=int64),)


In [43]:
#encontrar os índices em que os valores dos elementos são impares:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])

x = np.where(arr%2 == 1)
print(x)

(array([0, 2, 4, 6], dtype=int64),)


Também podemos utilizar a função searchsorted() para encontrar onde um valor específico deveria estar no array a fim de manter a ordem existente no array.

In [44]:
#exemplo:
import numpy as np
arr = np.array([6, 7, 8, 9])

x = np.searchsorted(arr, 5) 
#o resultado será 0 pois, para manter a ordem crescente já existente no array, o número 5 deverá estar na primeira posição

print(x)

0


Para pesquisar mais de um valor, usamos um array com valores especificados.

In [45]:
#encontrar onde deveriam ser inseridos os números 2, 4 e 6
import numpy as np
arr = np.array([1, 3, 5, 7])

x = np.searchsorted(arr, [2, 4, 6])
print(x)

[1 2 3]


#### Ordenando os elementos de um array

Podemos ordenar os elementos de um array utilizando a função sort() em um array específico. Esta função retornará uma cópia ordenada do array, deixando o original intacto.

In [46]:
#exemplo:
import numpy as np
arr = np.array([3, 2, 0, 1])
print(np.sort(arr))

[0 1 2 3]


In [47]:
#exemplo com um array de strings
import numpy as np
arr = np.array(['maça', 'banana', 'pêssego'])
print(np.sort(arr))

['banana' 'maça' 'pêssego']


#### Filtrando arrays

Filtrar arrays significa tirar alguns elementos de um array existente e criar um novo array contendo apenas esses elementos. Em Numpy fazemos isso utilizando uma lista de booleans com um boolean correspondendo a cada índice do array. Se, em determinado índice, o boolean é True, aquele elemento estará contido no novo array, enquanto que, se for False, aquele elemento não estará contido no novo array.

In [48]:
#exemplo:
import numpy as np
arr = np.array([1,2,3,4,5,6])
x = [False, True, False, True, False, True]

newarr = arr[x] #aqui estamos transformando nossa lista de booleans em um array
print(newarr)

[2 4 6]


Para fins de praticidade, quando estivermos trabalhando com arrays maiores, podemos também filtrar arrays da seguinte maneira:

In [49]:
#se quisermos apenas valores maiores que 5:
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8,9,10])

filter_arr = arr > 5 #aqui criamos um filtro para o array

newarr = arr[filter_arr] #aqui transformamos os valores filtrados em um novo array
print(newarr)

[ 6  7  8  9 10]


#### Gerando elementos e arrays aleatórios

Podemos usar Numpy para gerar números ou até mesmo arrays aleatórios. Utilizamos, para isso, o comando random.

In [50]:
#gerando um integer aleatório de 0 a 100:
from numpy import random
x = random.randint(100)
print(x)

3


Temos também a função rand(), que gera um float aleatório entre 0 e 1.

In [51]:
#exemplo:
from numpy import random
x = random.rand()
print(x)

0.5169015466976518


Para gerar arrays aleatórios, utilizamos qualquer um dos comandos acima. Para gerar um array aleatório com integers, usamos randint() acrescentando o parâmetro size, onde colocamos o número de linhas (no caso de arrays multidimensionais) e de elementos que desejamos.

In [52]:
#gerando um array com integers aleatórios entre 0 e 50, 2 dimensões, 3 linhas e 9 elementos cada:
from numpy import random
x = random.randint(50, size=(3, 9))
print(x)

[[15 21 42  4 13  9  4 10 47]
 [37  4 15 31 46 49  3 40 33]
 [ 6 45 16  9 20 30 18 32 42]]


Para gerar um array aleatório com floats, colocamos na função rand() o número de linhas (no caso de arrays multidimensionais) e de elementos que desejamos.