# Introdução

Ao trabalhar com algoritmos de inteligência artificial e ciência de dados, é comum
manipular dados organizados em arrays seja de strings e/ou números.

*O problema:* a linguagem Python oferece listas para manipulação de arrays, porém
essas estruturas apresentam baixo desempenho.

### O que é o NumPy?

NumPy é uma biblioteca de código aberto para Python usada para a manipulação de
arrays como operações no domínio de *álgebra linear*, *transformada de Fourier* e
*matrizes*: 

 - Até 50x mais rápido do que as listas em Python
 - Arrays do NumPy são armazenados de maneira *contígua na memória*, diferente das
listas.

### Por que o NumPy é mais rápido?

O NumPy é uma biblioteca escrita parcialmente em Python, mas a maior parte que
demanda alto desempenho, é escrita em C e C++.

![{547BAE41-A6A8-41E4-A495-50160F22F22A}.png](attachment:{547BAE41-A6A8-41E4-A495-50160F22F22A}.png)

# Uso básico do NumPy

In [111]:
# Importação do NumPy usando alias np
import numpy as np

In [112]:
# Declaração de um array usando lista
array = np.array([1, 2, 3, 4, 5])
# Impressão array
print(array)
# Tipo do array
print(type(array))
# Declaração de um array usando tupla
array2 = np.array((1, 2, 3, 4, 5))
# Impressão da tupla
print(array2)
# Tipo do array2
print(type(array2))

[1 2 3 4 5]
<class 'numpy.ndarray'>
[1 2 3 4 5]
<class 'numpy.ndarray'>


# Dimensões do Array

In [113]:
# Declaração de um array 0- Dimension
array0 = np.array(68)
print(array0)
# Declaração de um array 1- Dimension
array1 = np.array([1, 6, 9, 15, 20])
print(array1)
# Declaração de um array 2- Dimension
array2 = np.array([[90, 120, 180], [32, 58, 11], [5, 0, 552]])
print(array2)
# Declaração de um array 3- Dimension
array3 = np.array(
    [
        [[90, 120, 180], [90, 120, 180], [90, 120, 180]],
        [[32, 58, 11], [32, 58, 11], [32, 58, 11]],
        [[5, 0, 552], [5, 0, 552], [5, 0, 552]],
    ]
)
print(array3)
# Imprimir o número de dimensões do array
print(array0.ndim)
print(array1.ndim)
print(array2.ndim)
print(array3.ndim)


68
[ 1  6  9 15 20]
[[ 90 120 180]
 [ 32  58  11]
 [  5   0 552]]
[[[ 90 120 180]
  [ 90 120 180]
  [ 90 120 180]]

 [[ 32  58  11]
  [ 32  58  11]
  [ 32  58  11]]

 [[  5   0 552]
  [  5   0 552]
  [  5   0 552]]]
0
1
2
3


# Acesso de elementos do Array

In [114]:
# Declaração de um array 1- Dimension
array1 = np.array([1, 6, 9, 15, 20])
print(array1)
print("Terceiro elemento do array : {}".format(array1[2]))
# Declaração de um array 2- Dimension
array2 = np.array([[90, 120, 180], [32, 58, 11], [5, 0, 552]])
print(array2)
print("Segunda linha e terceira coluna : {}".format(array2[1][2]))
print("Último elemento da terceira linha : {}".format(array2[2, -1]))

[ 1  6  9 15 20]
Terceiro elemento do array : 9
[[ 90 120 180]
 [ 32  58  11]
 [  5   0 552]]
Segunda linha e terceira coluna : 11
Último elemento da terceira linha : 552


# Acesso a elementos de um intervalo de um array

In [115]:
# Declaração de um array 1- Dimension
array1 = np.array([1, 6, 9, 15, 20])
print("Terceiro elemento ao quinto elemento do array1 : {}".format(array1[2:5]))
# Declaração de um array 2- Dimension
array2 = np.array([[90, 120, 180], [32, 58, 11], [5, 0, 552], [19, 66, 202]])
print("1a. até 2a. linha do array : \n{}".format(array2[1:3]))
print(
    "1a. até 2a. linha do array , somente terceira coluna : {}".format(array2[1:3, 2])
)

Terceiro elemento ao quinto elemento do array1 : [ 9 15 20]
1a. até 2a. linha do array : 
[[ 32  58  11]
 [  5   0 552]]
1a. até 2a. linha do array , somente terceira coluna : [ 11 552]


# Tipos de dados em NumPy

NumPy possui uma diversidade de tipos de dados que podem ser mencionados por
meio de um único carácter:

| Catactere     | Tipo de dado       |
| ------------- | ------------------ |
| i             | integer            |
| ?             | boolean            |
| u             | unsigned integer   |
| f             | float              |
| c             | complex float      |
| m             | timedelta          |
| M             | datetime           |
| O             | object             |
| S             | string             |
| E muitos      | outros...          |

Para mais informações segue o link da [Documentação NumPy - Tipos de dados](https://numpy.org/devdocs//reference/arrays.dtypes.html)

### Exemplos de uso dos tipos de dados do NumPy

In [116]:
array = np.array([5, 6, 10, 15], dtype=np.int8)
print(array)
print(array.dtype)

[ 5  6 10 15]
int8


In [117]:
nomes = np.array(["João de souza", "Fernando", "Julio"])
print(nomes)
print(
    "{} -> Tamanho em unidades de unicode baseado na maior string".format(nomes.dtype)
)

['João de souza' 'Fernando' 'Julio']
<U13 -> Tamanho em unidades de unicode baseado na maior string


# Checando o tipo de dado de um array

In [118]:
array1 = np.array([1, 6, 9, 15, 20])
print(array1.dtype)
cores = np.array(["Fernando ", "Julia ", "Silmara ", "Jason "])
print(cores.dtype)

int64
<U9


# Convertendo tipo de dados de arrays existentes

Uma das formas mais rápidas de trocar o tipo de dados de um array, é por meio do
método `astype()`:

In [119]:
pesos = np.array([56.2, 64.1, 90.2, 20.8, 47.1])
print(pesos)
print(pesos.dtype)
pesos2 = pesos.astype("i")
print(pesos2)
print(pesos2.dtype)

[56.2 64.1 90.2 20.8 47.1]
float64
[56 64 90 20 47]
int32


# Copy and View

Um array NumPy oferece os métodos `copy()` e `view()`. 

A diferençaa entre o método `copy()` e o `view()` é que o copy produz um novo array,
enquanto a view é uma visão do array original.


In [120]:
# Uso do copy
alturas = np.array([1.88, 1.95, 1.64, 1.65, 1.72])
novaAlturas = alturas[0:2].copy()
print(novaAlturas)
copia_das_alturas = np.copy(alturas)
print(copia_das_alturas)
novaAlturas[0] = 2
copia_das_alturas[0] = 1
print(
    "\nValores após alteração (Não altera o valor dos outros, apenas de si próprios\n"
)
print(alturas)
print(novaAlturas)
print(copia_das_alturas)

[1.88 1.95]
[1.88 1.95 1.64 1.65 1.72]

Valores após alteração (Não altera o valor dos outros, apenas de si próprios

[1.88 1.95 1.64 1.65 1.72]
[2.   1.95]
[1.   1.95 1.64 1.65 1.72]


In [121]:
# Uso do View
alturas = np.array([1, 2, 3, 4, 5])
alturas_view = alturas.view()
print(alturas)
print(alturas_view)
alturas_view[0] = 10
print(
    "\nValores após alteração (Altera o valor dos outros, podendo gerar erros ou inconsistências\n"
)
print(alturas)
print(alturas_view)

[1 2 3 4 5]
[1 2 3 4 5]

Valores após alteração (Altera o valor dos outros, podendo gerar erros ou inconsistências

[10  2  3  4  5]
[10  2  3  4  5]


# Shape

O shape de um array é o número de elementos contidos em cada dimensão. Por exemplo, em uma matriz de 2 linhas e 4 colunas, o atributo shape é (2, 4). Já um vetor com 5 elementos, teria o shape (1, 5)

In [122]:
precosPorCategoria = np.array(
    [
        [10.50, 9.54, 1.08, 7.98, 5, 6, 7],
        [3.69, 5.49, 6.39, 4.20, 5, 6, 7],
        [3.69, 5.49, 6.39, 4.20, 5, 6, 7],
        [3.69, 5.49, 6.39, 4.20, 5, 6, 7],
    ]
)
print(precosPorCategoria.shape)
print("Linhas: {}".format(precosPorCategoria.shape[0]))
print("Colunas: {}".format(precosPorCategoria.shape[1]))

(4, 7)
Linhas: 4
Colunas: 7


In [123]:
array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
print(array.shape)

(9,)


# Reshape

Reformatar um array significa alterar o seu formato de dimensões.

O shape é o número de elementos em cada dimensão. Por meio do reshape é possível adicionar ou remover dimensões e alterar o número
de elementos em cada dimensão.

In [124]:
numeros = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
print(numeros)
print(numeros.shape)

print("\n----------\n")

array = numeros.reshape(4, 3)
print(array)
print(array.shape)

[ 1  2  3  4  5  6  7  8  9 10 11 12]
(12,)

----------

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
(4, 3)


> Atenção!
>
> A função `reshape()` tem o mesmo comportamento que a função `view()` em questão de manipulação dos dados do array.
> Alterando o dado do `array2` também alterará o dado do `array`.

In [125]:
array2 = array.reshape(3,4)
print(array2)
print(array2.shape)
array2[1,1] = 500

print("\n----------\n")

print("array: {}".format(array))
print("array2: {}".format(array2))

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
(3, 4)

----------

array: [[  1   2   3]
 [  4   5 500]
 [  7   8   9]
 [ 10  11  12]]
array2: [[  1   2   3   4]
 [  5 500   7   8]
 [  9  10  11  12]]


Para resolver este problema, chamamos no final do `reshape()` a função `copy()`.

In [126]:
array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
print(array)
print(array.shape)

print("\n----------\n")

array2 = array.reshape(3,4).copy()
print(array2)
print(array2.shape)
array2[1,1] = 500

print("\n----------\n")

print("array: {}".format(array))
print("array2: {}".format(array2))

[ 1  2  3  4  5  6  7  8  9 10 11 12]
(12,)

----------

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
(3, 4)

----------

array: [ 1  2  3  4  5  6  7  8  9 10 11 12]
array2: [[  1   2   3   4]
 [  5 500   7   8]
 [  9  10  11  12]]


Também podemos transformar um array de uni-dimensional para uma matriz tri-dimensional

In [127]:
array = np.array([1, 2, 3, 4, 5, 6, 7, 8])
array3 = array.reshape(2, 2, 2).copy()
print(array3)
print(array3.shape)

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
(2, 2, 2)


# Utilizando Flatten para desconstruir dimensões dos arrays

A função `flatten()`desconstrui as dimensões dos vetores, transformando por exemplo, um vetor de 2 dimensões para 1 dimensão.

> Obs:
>
> O `flatten()`já faz a cópia do vetor original

In [128]:
array2d = np.array([[1, 2, 3], [4, 5, 6]])
array1d = array2d.flatten()
print(array1d)

[1 2 3 4 5 6]


# Iterando sobre NumPy Arrays

Um array de 1-dimensão pode conter 0 ou mais elementos. Em situações em que é
preciso percorrer pelos elementos do array, pode-se utilizar o laço for

In [129]:
numeros = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
for n in numeros:
    print(n)

1
2
3
4
5
6
7
8
9
10
11
12


Uma matriz de 2-dimensões o laço for irá retornar elemento por elemento da 1a.
dimensão. No caso, um elemento seria um array contendo os seus elementos.
Para exibir cada elemento da matriz, é preciso aninhar dois laços for.

In [130]:
precosPorCategoria = np.array([[10.50, 9.54, 1.08, 7.98], [3.69, 5.49, 6.39, 4.20]])
for categoria in precosPorCategoria:
    print(categoria)
    for categoria in precosPorCategoria:
        for preco in categoria:
            print(preco)

[10.5   9.54  1.08  7.98]
10.5
9.54
1.08
7.98
3.69
5.49
6.39
4.2
[3.69 5.49 6.39 4.2 ]
10.5
9.54
1.08
7.98
3.69
5.49
6.39
4.2


# União de NumPy arrays

Para casos em que é necessário unir dois arrays distintos, o NumPy oferece o método
`concatenate()`.

In [131]:
usersFromSource1 = np.array(["john@email.com", "sara@email2.com", "crist@laznnn.com"])
usersFromSource2 = np.array(["linda@email.com", "hommer@email2.com", "muhim@czwwz.com"])
users = np.concatenate((usersFromSource1, usersFromSource2))
print(users)

['john@email.com' 'sara@email2.com' 'crist@laznnn.com' 'linda@email.com'
 'hommer@email2.com' 'muhim@czwwz.com']


# Split de arrays

O método `array_split()` realiza a operação inversa do join. A função
`array_split()` precisa do array a ser dividido e o número de divisões.

In [132]:
results = np.array(
    [
        "magazine ",
        "guidance ",
        "message ",
        " recognition",
        "office ",
        "cheek ",
        "length ",
        "stranger ",
        "trainer ",
        "ability ",
        "permission ",
        "singer ",
        "protection ",
        "manager ",
        "collection ",
        "selection ",
        "effort ",
        "promotion ",
        "village ",
        "solution ",
    ]
)
resultsPage = np.array_split(results, 5)
for page in resultsPage:
    print(page)

['magazine ' 'guidance ' 'message ' ' recognition']
['office ' 'cheek ' 'length ' 'stranger ']
['trainer ' 'ability ' 'permission ' 'singer ']
['protection ' 'manager ' 'collection ' 'selection ']
['effort ' 'promotion ' 'village ' 'solution ']


# Busca em arrays

O NumPy oferece o método `where()` para retornar os índices de um determinado
valor caso exista no array.

In [133]:
produtos = np.array(
    ["salame ", "cerveja ", "queijo ", "salame ", "palmito ", "pão de alho "]
)
results = np.where(produtos == "salame ")
print(results)

(array([0, 3]),)


# Ordenação de elementos do array

O método `sort()` permite ordenar em ordem crescente ou decrescente os elementos
de um array.

In [134]:
produtos = np.array(
    ["salame ", "cerveja ", "queijo ", "salame ", "palmito ", "pão de alho "]
)
produtosOrdenados = np.sort(produtos)
print(produtosOrdenados)
ids = np.array([1593, 292, 375, 8381, 84111, 558961, 110, 158, 5])
idsOrdenados = np.sort(ids)
print(idsOrdenados)

['cerveja ' 'palmito ' 'pão de alho ' 'queijo ' 'salame ' 'salame ']
[     5    110    158    292    375   1593   8381  84111 558961]


Já o método `flip()` ordena o array de maneira inversa ao `sort()`

In [140]:
ids = np.array([1593, 292, 375, 8381, 84111, 558961, 110, 158, 5])
idsOrdenados = np.sort(ids)
idsReversos = np.flip(idsOrdenados)
print(idsReversos)

[558961  84111   8381   1593    375    292    158    110      5]


Para arrays bi-dimensionais, o `sort()` funciona desta maneira:

In [147]:
array = np.array(
    [[6, 5, 4, 3, 2, 1], [60, 50, 40, 30, 20, 10], [40, 20, 10, 30, 35, 5]]
)
sortedArray = np.sort(array)
print(sortedArray)

print('\nInverso\n')
print(np.flip(sortedArray))

[[ 1  2  3  4  5  6]
 [10 20 30 40 50 60]
 [ 5 10 20 30 35 40]]

Inverso

[[40 35 30 20 10  5]
 [60 50 40 30 20 10]
 [ 6  5  4  3  2  1]]


# Filtro em array

Filtragem é o processo de oter alguns elementos de um array existente, criando um
novo array.

In [136]:
produtos = np.array(
    ["salame ", "cerveja ", "queijo ", "salame ", "palmito ", "pão de alho "]
)
indexSemSalame = np.where(produtos != "salame ")
print(indexSemSalame)
arraySemSalame = produtos[indexSemSalame]
print(arraySemSalame)

(array([1, 2, 4, 5]),)
['cerveja ' 'queijo ' 'palmito ' 'pão de alho ']


# Matrizes com NumPy

In [141]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
print(A)
print(B)
print("Diagonal principal : \n{}".format(np.diagonal(A)))
print("Diagonal reversa : \n{}".format(np.fliplr(A).diagonal()))
print("Matriz transposta : \n{}".format(np.transpose(A)))

[[1 2]
 [3 4]]
[[5 6]
 [7 8]]
Diagonal principal : 
[1 4]
Diagonal reversa : 
[2 3]
Matriz transposta : 
[[1 3]
 [2 4]]


# Operação aritmética com matrizes

In [138]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
C_sum = A + B
print("Soma : \n{}".format(C_sum))
C_multiply = A * B
print("Multiplicação: \n{}".format(C_multiply))
C_matmul = np.matmul(A, B)
print("Multiplicação Matricial : \n{}".format(C_matmul))

Soma : 
[[ 6  8]
 [10 12]]
Multiplicação: 
[[ 5 12]
 [21 32]]
Multiplicação Matricial : 
[[19 22]
 [43 50]]
