# <font color="red"> MBA em IA e Big Data</font>
## <span style="color:red">Linguagens e Ferramentas para Inteligência Artificial e Big Data (Python e SQL)</span>

### <span style="color:darkred">Python: Aula 15</span>

*Leandro Franco de Souza*<br>
*ICMC/USP São Carlos*

*(com material do Prof. Moacir Antonelli Ponti)*

# <font color="red"> Conteúdo:</font>

### <span style="color:red">- Modulo: Numpy</span>
### <span style="color:red">- Numpy: Arrays</span>
### <span style="color:red">- Especificando tipo *astype*</span>
### <span style="color:red">- Acessando elementos</span>
### <span style="color:red">- iterando com *for*</span>

## Numpy 

Processamento vetorial/matricial:
- métodos são majoritariamente escritos em C, garantindo eficiência computacional
- recursos para computação científica e álgebra linear

Outros pacotes dependem fortemente de `numpy`:
- `pandas`
- `matplotlib`
- `sklearn`

# Numpy Arrays

A estrutura de dados base, se assemelham às listas em Python, no entanto:
- Todo elemento em um array deve ser do mesmo tipo, tipicamente `float` ou `int`;
- Arrays viabilizam a realização eficiente de operações numéricas com grandes quantidades de dados, mais eficientes que listas;
- Cada dimensão de um array é chamada de eixo (_axis_)
- Eixos são numerados a partir de `0`
- Elementos acessados utilizando colchetes `[]`

### Construindo arrays

#### A partir de listas

Utilizando o construtor `numpy.array()`

In [None]:
import numpy as np

lista = [1, 3, 5, 7, 13]
a1d = np.array(lista)

print('Lista:', lista)
print('Numpy array:', a1d)

#### Por métodos `numpy`:

`zeros`, `ones`,  `arange`,  `linspace`

In [None]:
# array com oito elementos iguais a zero
b1d = np.zeros((8))  
print('Zeros: ',b1d)

# array com dez elementos iguais a um
c1d = np.ones((10))  
print('Ones: ',c1d)

# array com numeros entre 1 e menor que 11, com passo 2 (similar a `range`)
d1d = np.arange(0,11,2)  
print('Range: ',d1d)

# array com 5 números igualmente espaçados no intervalo entre 1 e 2 
e1d = np.linspace(1,2,6) 
print('Linspace: ',e1d)

e1d2 = np.linspace(0,1,11) 
print('Linspace2: ',e1d2)

#### Arrays multidimensionais

In [None]:
a2d = np.array([[1,3,5,7,9,11],
                [2,4,6,8,10,12],
                [0,1,2,3,4,5]]  )
print('a2d=\n',a2d)

In [None]:
#matriz 5X3 de zeros
b2d = np.zeros((5,3))  
print('Zeros 2d: \n',b2d)

# criando matriz 4X8 de 1s
c2d = np.ones((4,8))
print('Ones 2d:\n',c2d)

# criando matrix identidade 3X3
d2d = np.identity(3) 
print('Identity: \n',d2d)

Arrays são objetos _ndarrays_ 

Seus atributos são: 
- `ndarray.ndim`: número de eixos (dimensões) do array
- `ndarray.shape`: uma tupla de inteiros indicando o tamanho do array em cada dimensão
- `ndarray.size`:  o número total de elementos do array
- `ndarray.dtype`: tipo dos elementos no array
- `ndarray.itemsize`: o tamanho em bytes de cada elemento do array
- `ndarray.T`: versão transposta do array

In [None]:
print(a1d)
print(c2d)

In [None]:
print(" ndim: numero de eixos dos arrays")
print('a1d.ndim =',a1d.ndim)
print('c2d.ndim =',c2d.ndim)

In [None]:
print("\n shape: tamanho do array em cada dimensao")
print('a1d.shape =',a1d.shape)
print('b1d.shape =',b1d.shape)
print('a2d.shape =',a2d.shape)
print('c2d.shape =',c2d.shape)

In [None]:
print("\n size: numero total de elementos")
print('a1d.size =',a1d.size)
print('b1d.size =',b1d.size)
print('a2d.size =',a2d.size)
print('c2d.size =',c2d.size)

In [None]:
print("\n dtype: tipo dos elementos")
print('a1d.dtype =',a1d.dtype)
print('b1d.dtype =',b1d.dtype)
print('a2d.dtype =',a2d.dtype)
print('c2d.dtype =',c2d.dtype)

In [None]:
print("\n itemsize: tamanho em bytes de cada elemento")
print('a1d.itemsize =',a1d.itemsize)
print('b1d.itemsize =',b1d.itemsize)
print('a2d.itemsize =',a2d.itemsize)
print('c2d.itemsize =',c2d.itemsize)

### Especificando tipo com `astype()`

In [None]:
print('d2d.dtype =',d2d.dtype)
print(d2d)

d2d = d2d.astype(int)
print('d2d.dtype =',d2d.dtype)
print(d2d)

d2d = d2d.astype(np.uint16)
print('d2d.dtype =',d2d.dtype)
print(d2d)

### Dimensão livre

Arrays unidimensionais podem ter uma das dimensões livres. 

In [None]:
a = np.zeros((5))
b = np.zeros((5,1))
print('a.shape = ',a.shape)
print('b.shape = ',b.shape)
print('a.ndim  = ',a.ndim)
print('b.ndim  = ',b.ndim)

array com shape (5,) possui apenas 1 eixo;<br> 
array com shape (5,1) possui 2 eixos (ndim = 2) 

* Este último corresponde a uma matrix com 5 linhas e 1 coluna.

### Acessando elementos de um array

Similar a sequências, mas usamos apenas um colchete, mesmo para arrays multidimensionais

In [None]:
a1d[3:]

In [None]:
print(a2d)

In [None]:
print(a2d[ 0, 0])
print(a2d[ 1, 3])
print(a2d[-1,-2])

In [None]:
print(a2d[0])

### Iterando com `for`

> percorre cada linha.

* Podemos enumerar as linhas para pegar seus índices.
* Iterar por elementos exige laço duplo ou achatar (*flatten*) o array.

In [None]:
for el in a1d:
    print(el)

In [None]:
for el in a2d:
    print(el)

In [None]:
# usamos enumerate para retornar a enumeração e cada linha
for i, el in enumerate(a2d):
    print('Linha', i, '=', el)

In [None]:
print(d2d)

In [None]:
# iterando utilizando indices
for i in range(d2d.shape[0]): 
    for j in range(d2d.shape[1]):
        print('elemento ',i,' ',j,' = ', d2d[i,j])

In [None]:
# o atributo 'flat' coloca todos os elementos como em uma lista
for i,el in enumerate(d2d.flat):
    print(i,el)

---
#### <font color="blue">Exercício 2.4 </font>

Dada uma lista de tuplas, em que cada tupla é formada por um par (str,list). Ver um exemplo abaixo.

```
l_tup = [('a',[8, 4, 6, 1]), ('b',[1, 2, 3, 4]), ('c',[5, 3, 3, 3])]
```

* Converta a lista de tuplas em um numpy array bidimensional em que cada lista é transformada em uma linha do array, ignorando a string. 
* Percorra cada linha do array resultante usando `for`, exibindo na tela os 3 últimos elementos de cada array

Seu código deve funcionar para qualquer número de tuplas na lista, assuma que as listas tem sempre o mesmo número de elementos, todos numéricos.

---

# <font color="red">Resumo da aula</font>

### <span style="color:red">- Modulo: Numpy</span>
### <span style="color:red">- Numpy: Arrays</span>
### <span style="color:red">- Especificando tipo *astype*</span>
### <span style="color:red">- Acessando elementos</span>
### <span style="color:red">- iterando com *for*</span>