# Aula 11. NumPy

<img  src='img/numpy.png' width='600' height='400' />

NumPy é uma das bibliotecas mais poderosas da linguagem Python. Esta biblioteca trabalha com matrizes e arrays multidimensionais. Possui uma grande coleção de funções para realizar operações matemáticas com alta performance (como vimos na aula de comparação performática).

- Esta biblioteca possui seus próprios tipos de dados os quais são do tipo `numpy.ndarray`;
- Trabalhar com matrizes e vetores usando np.ndarrays é mais eficiente que utilizar objetos do tipo lista;
- Numpy é utilizada amplamente para realizar:
    - Computação quântica;
    - Computação estatística; 
    - Processamento de sinal;
    - Processamento de imagem;
    - Visualização 3D;
    - Computação simbólica;
    - Processamento astronômico;
    - BioInoformatica;
    - Inferência Bayesiana;
    - Análise matemática;
    - Simulação e modelagem (Monte Carlo);
    - Análise de multivariável;
    - E infinidades de outras alternativas.
- Recomendo (fortemente) visitar o site de [Numpy](https://numpy.org/) para conhecer mais sobre esta biblioteca.
---
<font size="5"> Os tópicos que vamos abordar nesta série de conversas são:</font>
- List vs Numpy;
- Indexação e fatiamento Numpy;
- Arrays fila e arrays coluna;
- Eliminando elementos, função delete;
- Adicionando elementos insert e append;
- Operações algebraicas com arrays (+, -, *, /, //, %);
- Cannivete NumPy:
 - arange;
 - linspace;
 - ones, zeros e eye;
 - Shape;
 - Size;
 - dimensão;
 - reshape;
 - asarray;
 - where;
- Carregando dados com Numpy.

Esclarecimento: O objetivo de hoje é apresentar os aspectos **mais básicos** desta biblioteca devido a que conta com grande variedades de funções e aplicações.

## Listas vs Numpy

In [1]:
import numpy as np

In [4]:
l1  = [[1, 2, 3],
      [4, 5, 6],
      [7, 8, 9]]
l1
# Observemos que la visualização de uma matriz usando listas não é muito amigável

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [5]:
# Acessando à primeira fila
l1[0]

[1, 2, 3]

In [7]:
# E para acessar à primeira coluna?
l1[:]
# Não é possível ingressar a colunas quando utilizado listas

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [9]:
array1  = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])
array1
# Observemos que ao se utilizar np.array() a visualização fica mais agradável

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [10]:
# Acessando à primeira fila
array1[0,:]

array([1, 2, 3])

In [11]:
array1[:, 0]

array([1, 4, 7])

In [13]:
# Acessando à primeira coluna
array1[:, -1]
# E podemos ingressar às colunas

array([3, 6, 9])

## Indexação e fatiamento

Os Arrays se comportam da mesma forma que as listas (até certo ponto), a sua indexação inicia em 0 e vai até o último elemento representado por -1.

In [14]:
array = np.array([0,1,2,3,4,5,6])

In [15]:
print(array) # Imprimindo o array
print(array[:]) # acessando ao todos os elementos
print(array[0]) # acessando ao primer elemento
print(array[1]) # acessando ao segundo elemento
print(array[-1]) # acessando ao ultimo elemeto

[0 1 2 3 4 5 6]
[0 1 2 3 4 5 6]
0
1
6


In [16]:
print(array[1:-1]) # fatiando um array 
print(array[0:3]) # fatiando um array
print(array[1:]) # fatiando um array
print(array[0::2]) # fatiando um array com `step`
# Observemos que o último é excluido

[1 2 3 4 5]
[0 1 2]
[1 2 3 4 5 6]
[0 2 4 6]


Como seria o fatiamento de uma matriz?

$$array =   \left( \begin{matrix} a & b \\ c & d \end{matrix} \right)$$
$$array[:, 0] =   \left( \begin{matrix} a & c  \end{matrix} \right)$$
$$array[0, :] =   \left( \begin{matrix} a & b  \end{matrix} \right)$$
$$array[row, colum])$$

Observemos que o primeiro elemento representa as filas e o segundo as colunas

In [17]:
# Como seria o fatiamento com uma matriz?
print("Array original")
print(array1[:]) # Toda a matriz

Array original
[[1 2 3]
 [4 5 6]
 [7 8 9]]


In [18]:
print("Todos os elementos da primeira fila")
print(array1[0, :]) # Todos os elementos da primeira fila
print(array1[0])
print(array1[0][:])

Todos os elementos da primeira fila
[1 2 3]
[1 2 3]
[1 2 3]


In [19]:
print("Todos os elementos da última fila")
print(array1[-1, :]) # Todos os elementos da última fila
print(array1[-1][:]) 
print(array1[-1]) 

Todos os elementos da última fila
[7 8 9]
[7 8 9]
[7 8 9]


In [21]:
print("Todos os elementos da primeira coluna")
print(array1[:, 0]) # Todos os elementos da primeira coluna
print(array1[:][0]) # ? # Esta sintaxe não é adequada par relizar fatiamento da primeira coluna

Todos os elementos da primeira coluna
[1 4 7]
[1 2 3]


In [22]:
array1[:][0]

array([1, 2, 3])

In [23]:
print("Todos os elementos da última coluna")
print(array1[:, -1]) # Todos os elementos da última coluna

Todos os elementos da última coluna
[3 6 9]


In [24]:
print("segundo elemento da segunda coluna")
print(array1[1, 1]) # segundo elemento da segunda coluna

segundo elemento da segunda coluna
5


## Array fila e array coluna

Algumas IDEs podem mostrar os array coluna da mesma forma que um array vetor. Porém esses são objetos diferentes. Além disso, algumas operações matriciais precisam do vetor configurado como uma fila e não como uma coluna.

In [27]:
array = np.array([1, 2, 3])
array_coluna = np.array([[1], [2], [3]])
array_fila = np.array([[1, 2, 3]])

In [28]:
print(array)
print(array_coluna)
print(array_fila)

[1 2 3]
[[1]
 [2]
 [3]]
[[1 2 3]]


In [29]:
print("size")
print(array.size)
print(array_coluna.size)
print(array_fila.size)

size
3
3
3


In [30]:
print("shape")
print(array.shape)
print(array_coluna.shape)
print(array_fila.shape)

shape
(3,)
(3, 1)
(1, 3)


In [31]:
print("Dimensão")
print(array.ndim)
print(array_coluna.ndim)
print(array_fila.ndim)

Dimensão
1
2
2


## Eliminando elementos, função delete

In [33]:
print("Arrey Original")
print(array1)
print("-"*15)
print("Eliminando a primeira fila")
print(np.delete(array1, 0, 0)) # Eliminando a primeira fila
print("-"*15)
print("Eliminando a primeira coluna")
print(np.delete(array1, 0, 1)) # Eliminando a primeira coluna

Arrey Original
[[1 2 3]
 [4 5 6]
 [7 8 9]]
---------------
Eliminando a primeira fila
[[4 5 6]
 [7 8 9]]
---------------
Eliminando a primeira coluna
[[2 3]
 [5 6]
 [8 9]]


## Adicionando elementos append e insert 

### append

In [38]:
print("Array original")
print(np.array(np.array([1, 2, 3])))
print("Adicionando todos os elementos no final do array 1D")
np.append(array, [7,8,9])  # Adicionando todos os elementos no final do array 1D

Array original
[1 2 3]
Adicionando todos os elementos no final do array 1D


array([1, 2, 3, 7, 8, 9])

In [39]:
array

array([1, 2, 3])

In [40]:
print("Array original")
print(np.array([[1, 2, 3]]) )
print("Adicionando os elementos como uma nova fila")
np.append(np.array([[1, 2, 3]]), [[10, 20, 30]], axis=0) # Adicionando os elementos como uma nova fila

Array original
[[1 2 3]]
Adicionando os elementos como uma nova fila


array([[ 1,  2,  3],
       [10, 20, 30]])

In [41]:
print("Array original")
print(np.array([[1, 2, 3]]))
print("Adicionando os elementos como novas colunas")
np.append(np.array([[1, 2, 3]]), [[10, 20, 30]], axis=1) # Adicionando os elementos como novas colunas

Array original
[[1 2 3]]
Adicionando os elementos como novas colunas


array([[ 1,  2,  3, 10, 20, 30]])

In [42]:
np.array([[1, 2, 3]]).shape
# Observemos que o array original não foi modificado

(1, 3)

### insert

In [44]:
print("Array original")
print(array1)
print("-"*15)
print("Adicionando uma fila com o mesmo valor")
print(np.insert(array1, 0, 100, 0)) # Adicionando uma fila com o mesmo valor
print("-"*15)
print("Adicionando uma coluna com o mesmo valor")
print(np.insert(array1, 0, 100, 1)) # Adicionando uma coluna com o mesmo valor
print("-"*15)

Array original
[[1 2 3]
 [4 5 6]
 [7 8 9]]
---------------
Adicionando uma fila com o mesmo valor
[[100 100 100]
 [  1   2   3]
 [  4   5   6]
 [  7   8   9]]
---------------
Adicionando uma coluna com o mesmo valor
[[100   1   2   3]
 [100   4   5   6]
 [100   7   8   9]]
---------------


In [45]:
print("Array original")
print(array1)
print("-"*15)
print("Adicionando uma fila com o mesmo valor")
print(np.insert(array1, 0, [100, 200, 300], 0)) # Adicionando uma fila com o mesmo valor
print("-"*15)
print("Adicionando uma coluna com o mesmo valor")
print(np.insert(array1, 0,  [100, 200, 300], 1)) # Adicionando uma coluna com o mesmo valor
print("-"*15)

Array original
[[1 2 3]
 [4 5 6]
 [7 8 9]]
---------------
Adicionando uma fila com o mesmo valor
[[100 200 300]
 [  1   2   3]
 [  4   5   6]
 [  7   8   9]]
---------------
Adicionando uma coluna com o mesmo valor
[[100   1   2   3]
 [200   4   5   6]
 [300   7   8   9]]
---------------


### Modificando um unico elemento

In [46]:
print("Array original")
array1 = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])
print(array1)
print("Array modificado")
array1[1, 1] = 500
print(array1)

Array original
[[1 2 3]
 [4 5 6]
 [7 8 9]]
Array modificado
[[  1   2   3]
 [  4 500   6]
 [  7   8   9]]


## Operações algebraicas
Uma das vantagens dos numpy.ndarray é que as operações algebraicas estão definidas entre esse tipo de dados e dados do tipo numérico como float, int e complex. 

Lembrando que estas operações não estão definidas entre objetos do tipo lista

In [48]:
# Utilizando vetor de 1D
array1 = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
print("-"*15)
print(f"Soma: {array1 + 500}")
print("-"*15)
print(f"Substração: {array1 - 500.5}")
print("-"*15)
print(f"Multiplicação: {array1 * 1 + 0.5j}")
print("-"*15)
print(f"Divisão: {array1 / 0.1}")
print("-"*15)
print(f"Modulo: {array1 % 2}")
print("-"*15)
print(f"Parte inteira: {array1 // 2}")

---------------
Soma: [501 502 503 504 505 506 507 508 509]
---------------
Substração: [-499.5 -498.5 -497.5 -496.5 -495.5 -494.5 -493.5 -492.5 -491.5]
---------------
Multiplicação: [1.+0.5j 2.+0.5j 3.+0.5j 4.+0.5j 5.+0.5j 6.+0.5j 7.+0.5j 8.+0.5j 9.+0.5j]
---------------
Divisão: [10. 20. 30. 40. 50. 60. 70. 80. 90.]
---------------
Modulo: [1 0 1 0 1 0 1 0 1]
---------------
Parte inteira: [0 1 1 2 2 3 3 4 4]


In [49]:
# Utilizando matrix de 2D
array1 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("-"*15)
print(f"Soma:\n {array1 + 500}")
print("-"*15)
print(f"Substração:\n {array1 - 500.5}")
print("-"*15)
print(f"Multiplicação:\n {array1 * 1 + 0.5j}")
print("-"*15)
print(f"Divisão:\n {array1 / 0.1}")
print("-"*15)
print(f"Modulo:\n {array1 % 2}")
print("-"*15)
print(f"Parte inteira:\n {array1 // 2}")

---------------
Soma:
 [[501 502 503]
 [504 505 506]
 [507 508 509]]
---------------
Substração:
 [[-499.5 -498.5 -497.5]
 [-496.5 -495.5 -494.5]
 [-493.5 -492.5 -491.5]]
---------------
Multiplicação:
 [[1.+0.5j 2.+0.5j 3.+0.5j]
 [4.+0.5j 5.+0.5j 6.+0.5j]
 [7.+0.5j 8.+0.5j 9.+0.5j]]
---------------
Divisão:
 [[10. 20. 30.]
 [40. 50. 60.]
 [70. 80. 90.]]
---------------
Modulo:
 [[1 0 1]
 [0 1 0]
 [1 0 1]]
---------------
Parte inteira:
 [[0 1 1]
 [2 2 3]
 [3 4 4]]


In [50]:
# Operações algebraicas entre vetores
array1 = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
array2 = array1[::-1]
print(f"Array1 = {array1}")
print(f"Array2 = {array2}")
print(f"Soma: {array1 + array2}")
print("-"*15)
print(f"Substração: {array1 - array2}")
print("-"*15)
print(f"Multiplicação: {array1 * array2}")
print("-"*15)
print(f"Divisão: {array1 / array2}")
print("-"*15)
print(f"Modulo: {array1 % array2}")
print("-"*15)
print(f"Parte interia: {array1 // array2}")

Array1 = [1 2 3 4 5 6 7 8 9]
Array2 = [9 8 7 6 5 4 3 2 1]
Soma: [10 10 10 10 10 10 10 10 10]
---------------
Substração: [-8 -6 -4 -2  0  2  4  6  8]
---------------
Multiplicação: [ 9 16 21 24 25 24 21 16  9]
---------------
Divisão: [0.11111111 0.25       0.42857143 0.66666667 1.         1.5
 2.33333333 4.         9.        ]
---------------
Modulo: [1 2 3 4 0 2 1 0 0]
---------------
Parte interia: [0 0 0 0 1 1 2 4 9]


In [51]:
# Operações algebraicas entre matrices
array1 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
array2 = array1.T
print(f"Array1 = \n{array1}")
print(f"Array2 = \n{array2}")
print(f"Soma: \n{array1 + array2}")
print("-"*15)
print(f"Substração: \n{array1 - array2}")
print("-"*15)
print(f"Multiplicação: \n{array1 * array2}")
print("-"*15)
print(f"Divisão: \n{array1 / array2}")
print("-"*15)
print(f"Modulo: \n{array1 % array2}")
print("-"*15)
print(f"Parte interia: \n{array1 // array2}")

Array1 = 
[[1 2 3]
 [4 5 6]
 [7 8 9]]
Array2 = 
[[1 4 7]
 [2 5 8]
 [3 6 9]]
Soma: 
[[ 2  6 10]
 [ 6 10 14]
 [10 14 18]]
---------------
Substração: 
[[ 0 -2 -4]
 [ 2  0 -2]
 [ 4  2  0]]
---------------
Multiplicação: 
[[ 1  8 21]
 [ 8 25 48]
 [21 48 81]]
---------------
Divisão: 
[[1.         0.5        0.42857143]
 [2.         1.         0.75      ]
 [2.33333333 1.33333333 1.        ]]
---------------
Modulo: 
[[0 2 3]
 [0 0 6]
 [1 2 0]]
---------------
Parte interia: 
[[1 0 0]
 [2 1 0]
 [2 1 1]]


## Cannivete Numpy

### Array arange()

Função para criar um array de `n` elementos.

numpy.arange([start, ]stop, [step, ]dtype=None)

In [52]:
arange = np.arange(0, 5)
print(arange)

[0 1 2 3 4]


In [53]:
arange = np.arange(start=0, stop=10, step=0.2)
print(arange)

[0.  0.2 0.4 0.6 0.8 1.  1.2 1.4 1.6 1.8 2.  2.2 2.4 2.6 2.8 3.  3.2 3.4
 3.6 3.8 4.  4.2 4.4 4.6 4.8 5.  5.2 5.4 5.6 5.8 6.  6.2 6.4 6.6 6.8 7.
 7.2 7.4 7.6 7.8 8.  8.2 8.4 8.6 8.8 9.  9.2 9.4 9.6 9.8]


In [54]:
arange = np.arange(start=0, stop=5, step=0.5)
print(arange)

[0.  0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]


In [55]:
arange =np.arange(start=1, stop=100, step=0.05362)
print(arange)

[ 1.       1.05362  1.10724 ... 99.87528 99.9289  99.98252]


### linspace()
A funcionalidade é muito parecida com np.arange(), porém, está função garante sempre o mesmo espaçamento entre os pontos e o ultimo ponto é inclusivo.

 numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)[source]

In [56]:
linspace = np.linspace(start=1, stop=5, num=100)
print(linspace)

[1.         1.04040404 1.08080808 1.12121212 1.16161616 1.2020202
 1.24242424 1.28282828 1.32323232 1.36363636 1.4040404  1.44444444
 1.48484848 1.52525253 1.56565657 1.60606061 1.64646465 1.68686869
 1.72727273 1.76767677 1.80808081 1.84848485 1.88888889 1.92929293
 1.96969697 2.01010101 2.05050505 2.09090909 2.13131313 2.17171717
 2.21212121 2.25252525 2.29292929 2.33333333 2.37373737 2.41414141
 2.45454545 2.49494949 2.53535354 2.57575758 2.61616162 2.65656566
 2.6969697  2.73737374 2.77777778 2.81818182 2.85858586 2.8989899
 2.93939394 2.97979798 3.02020202 3.06060606 3.1010101  3.14141414
 3.18181818 3.22222222 3.26262626 3.3030303  3.34343434 3.38383838
 3.42424242 3.46464646 3.50505051 3.54545455 3.58585859 3.62626263
 3.66666667 3.70707071 3.74747475 3.78787879 3.82828283 3.86868687
 3.90909091 3.94949495 3.98989899 4.03030303 4.07070707 4.11111111
 4.15151515 4.19191919 4.23232323 4.27272727 4.31313131 4.35353535
 4.39393939 4.43434343 4.47474747 4.51515152 4.55555556 4.595959

In [57]:
linspace = np.linspace(start=1, stop=100, num=50)
print(linspace)

[  1.           3.02040816   5.04081633   7.06122449   9.08163265
  11.10204082  13.12244898  15.14285714  17.16326531  19.18367347
  21.20408163  23.2244898   25.24489796  27.26530612  29.28571429
  31.30612245  33.32653061  35.34693878  37.36734694  39.3877551
  41.40816327  43.42857143  45.44897959  47.46938776  49.48979592
  51.51020408  53.53061224  55.55102041  57.57142857  59.59183673
  61.6122449   63.63265306  65.65306122  67.67346939  69.69387755
  71.71428571  73.73469388  75.75510204  77.7755102   79.79591837
  81.81632653  83.83673469  85.85714286  87.87755102  89.89795918
  91.91836735  93.93877551  95.95918367  97.97959184 100.        ]


In [58]:
[linspace[i+1] - linspace[i] for i in range(len(linspace)-1)]

[2.020408163265306,
 2.020408163265306,
 2.020408163265306,
 2.020408163265306,
 2.020408163265305,
 2.020408163265307,
 2.020408163265307,
 2.020408163265305,
 2.020408163265305,
 2.020408163265305,
 2.0204081632653086,
 2.020408163265305,
 2.020408163265305,
 2.0204081632653086,
 2.020408163265305,
 2.020408163265305,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653086,
 2.0204081632653015,
 2.0204081632653157,
 2.0204081632653015,
 2.0204081632653015,
 2.0204081632653157,
 2.0204081632653015,
 2.0204081632653015,
 2.0204081632653015,
 2.0204081632653157,
 2.0204081632653015,
 2.0204081632653015,
 2.0204081632653157,
 2.0204081632653015,
 2.0204081632653015,
 2.0204081632653157,
 2.0204081632653015,
 2.020

**Cuidado com os espaçamento ao se utilizar np.arange() e np.linspace()**

### ones, zeros e eye

Numpy possui algumas funções para a criação de array de forma automática preenchidos com alguns valores. Este é o caso das funções `ones`, `zeros` e `aye`, as quais retornar array preenchidas com valores de 1, 0 e array com diagonal de 1.
```python
numpy.ones(shape, dtype=None, order='C')

numpy.zeros(shape, dtype=float, order='C')

numpy.eye(N, M=None, k=0, dtype=<class 'float'>, order='C')
```

In [59]:
np.ones(shape=(10,)).ndim

1

In [60]:
np.ones(shape=(10,1))

array([[1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.]])

In [61]:
np.ones(shape=(1, 10))

array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])

In [62]:
np.ones(shape=(10,10))

array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])

In [63]:
a = np.ones(shape=(10, 10), dtype=float)
a + 1

array([[2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.]])

In [64]:
np.eye(10)

array([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]])

In [65]:
np.eye(10,5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [66]:
np.eye(10,10, k=2)

array([[0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])

### Shape()

Retorna a ***configuração*** de um array

In [68]:
ones = np.ones((5,5))
print(ones)
np.shape(ones)

[[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]


(5, 5)

In [69]:
ones = np.ones((5, 1))
print(ones)
np.shape(ones)

[[1.]
 [1.]
 [1.]
 [1.]
 [1.]]


(5, 1)

In [70]:
ones = np.ones((1,5)) 
print(ones)
np.shape(ones)

[[1. 1. 1. 1. 1.]]


(1, 5)

In [71]:
ones = np.ones(15) 
print(ones)
np.shape(ones)

[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]


(15,)

Algumas objetos de numpy (e de outras bibliotecas) tem metodos definidos, e o shape é um deles. Isto quer dizer que podemos fazer `np.shape(ones)` ou `ones.shape` e o resultado vai ser o mesmo.

In [72]:
ones.shape

(15,)

### reshape()

Esta função reconfigura um array. Deve-se ter cuidado pois nem sempre é possível realizar a configuração, isto vai depender da forma do array original.
```python
numpy.reshape(a, newshape, order='C')
```

In [73]:
array_original = np.arange(1, 17)
print(array_original)

[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16]


In [74]:
print("Modificando o array para (1, 16)")
print(array_original.reshape(1,16))

Modificando o array para (1, 16)
[[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16]]


In [75]:
print("Modificando o array para (16, 1)")
print(array_original.reshape(16,1))

Modificando o array para (16, 1)
[[ 1]
 [ 2]
 [ 3]
 [ 4]
 [ 5]
 [ 6]
 [ 7]
 [ 8]
 [ 9]
 [10]
 [11]
 [12]
 [13]
 [14]
 [15]
 [16]]


In [76]:
print("Modificando o array para (4, 4)")
print(array_original.reshape(4,4))

Modificando o array para (4, 4)
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]
 [13 14 15 16]]


In [77]:
print("Modificando o array para (2, 8)")
print(array_original.reshape(2,8))

Modificando o array para (2, 8)
[[ 1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16]]


In [78]:
print("Modificando o array para (8, 2)")
print(array_original.reshape(8,2))

Modificando o array para (8, 2)
[[ 1  2]
 [ 3  4]
 [ 5  6]
 [ 7  8]
 [ 9 10]
 [11 12]
 [13 14]
 [15 16]]


In [79]:
np.reshape(array_original, (8,2))

array([[ 1,  2],
       [ 3,  4],
       [ 5,  6],
       [ 7,  8],
       [ 9, 10],
       [11, 12],
       [13, 14],
       [15, 16]])

### size()

Retorna o número de elementos contidos num np.array

In [85]:
array_original.size

16

### Dimension ndim()

Retorna o número de dimensões que um array possui.

In [86]:
print((array_original.ndim))
print(np.ones((10,10)).ndim)
print(array_original.reshape(2,4,2))
print(array_original.reshape(2,4,2).ndim)

1
2
[[[ 1  2]
  [ 3  4]
  [ 5  6]
  [ 7  8]]

 [[ 9 10]
  [11 12]
  [13 14]
  [15 16]]]
3


### where()

In [87]:
array_teste = np.random.randint(low=1, high=20, size=20)
print(array_teste)

print(np.where(array_teste<10, array_teste, 0))

[14  9  9  1 12 14  5  7 15 12 14  5 17  1  4 12 11 16 17  9]
[0 9 9 1 0 0 5 7 0 0 0 5 0 1 4 0 0 0 0 9]


In [88]:
# Usando como filtro e aplicando no array
np.where(array_teste<10, array_teste/10, array_teste)

array([14. ,  0.9,  0.9,  0.1, 12. , 14. ,  0.5,  0.7, 15. , 12. , 14. ,
        0.5, 17. ,  0.1,  0.4, 12. , 11. , 16. , 17. ,  0.9])

In [89]:
# Usando como filtro e aplicando no array
np.where(array_teste<10, array_teste, array_teste/10)

array([1.4, 9. , 9. , 1. , 1.2, 1.4, 5. , 7. , 1.5, 1.2, 1.4, 5. , 1.7,
       1. , 4. , 1.2, 1.1, 1.6, 1.7, 9. ])

In [91]:
# usando multiplas comparações
np.where((array_teste>5) & (array_teste<15), array_teste, 0)

array([14,  9,  9,  0, 12, 14,  0,  7,  0, 12, 14,  0,  0,  0,  0, 12, 11,
        0,  0,  9])

In [92]:
# USando multiplas comparações
np.where((array_teste>5) & (array_teste<15) | (array_teste == 18), array_teste, 0)
# Observemos que na biblioteca Numpy os operadores de comparação são diferentes. & representa and, e | representa or

array([14,  9,  9,  0, 12, 14,  0,  7,  0, 12, 14,  0,  0,  0,  0, 12, 11,
        0,  0,  9])

## Salvando e carregando dados

Numpy possui diversas formas de salvar arquivos, dentre elas temos `.csv`, `.txt`, `.npy` e `.npz`, porém vamos só ver o funcionamento com arquivos `.csv`.

In [93]:
# salvando um arquivo no formato .csv
dados = np.eye(1000)
print(dados)
np.savetxt("dados.csv",dados)

[[1. 0. 0. ... 0. 0. 0.]
 [0. 1. 0. ... 0. 0. 0.]
 [0. 0. 1. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 1. 0. 0.]
 [0. 0. 0. ... 0. 1. 0.]
 [0. 0. 0. ... 0. 0. 1.]]


In [94]:
# Carregando o arquivo
import numpy as np

a = np.loadtxt("Dados/dados.csv")
"""
OBSERVAÇÃO
O arquivo que vai ser carregado DEVE estar no mesmo diretório que o arquivo .py (ou .ipynb).
CASO CONTRARIO se deve indicar o endereço do diretório onde temos o arquivo armazenado.
"""
a 

array([[1., 0., 0., ..., 0., 0., 0.],
       [0., 1., 0., ..., 0., 0., 0.],
       [0., 0., 1., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 1., 0., 0.],
       [0., 0., 0., ..., 0., 1., 0.],
       [0., 0., 0., ..., 0., 0., 1.]])

In [95]:
# Carregando um arquivo ubicado num diretorio diferente
import numpy as np
from tabulate import tabulate
dados2 = np.loadtxt("/home/fernan/Desktop/dados2.csv") # esta linha deve ser modificada para usuarios diferentes
print(tabulate(dados2))
"""
Observação. O código anterior pode não funcionar. Só funciona para sistemas basados em POSIX
(UNIX e MAC), para windows não funciona (//, \\).
"""

OSError: /home/fernan/Desktop/dados2.csv not found.